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ALAho Jeff Ullman 
我 们 相信 ， 在 1992 年 ， 本 书 适合 用 来 
介绍 计算 机 科学 理论 ， 今 天 仍 是 。 
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内 容 提 要 


本 书 以 传统 计算 机 科学 课程 的 方式 ， 将 数据 结构 方面 的 初级 课程 与 离散 数学 课程 结合 在 一 起 ， 全 面 
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到 各 种 数据 模型 的 建立 ， 很 好 地 兼顾 了 学 科 广 度 和 主题 深度 ， 帮 助 读 者 培养 计算 机 领域 的 大 局 观 ， 学 习 
真正 的 计算 机 科学 知识 。 

本 书 适合 计算 机 专业 的 学 生 及 具有 计算 机 应 用 技术 基础 理论 知识 的 读者 阅读 。 
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编写 本 书 的 动机 源 于 我 们 对 进一步 革新 计算 机 科学 核心 课程 的 需求 。 作 为 对 讨论 了 计算 科 
学 入 门 课 程 的 “Denning 报告 ”( Denning、P.J.、D.E.Comer、 D. Gries、M. C. Mulder A. TucKker、 
J. Turner 和 了 R. Young, “Computing as a Discipline”，Comm. ACM32:1，9-23 页 ，1989 年 1 月 ) 
的 回应 ， 全 美的 很 多 学 校 都 修订 了 他 们 的 课程 。 这 篇 报告 引起 人 们 关注 作为 相关 学 科 所 有 本 科 
课程 之 基础 的 三 种 工作 方法 或 流程 一 一 理论 .抽象 和 设计 。 最 近 , ACMIEEE-CS Joint Curriculum 
Task Force 的 Computing Curricula 1991 报告 呼应 了 “Denning 报告 ” ， 特 别 是 确定 了 作为 计算 科 
学 之 本 的 那些 反复 出 现 的 关键 概念 : 概念 上 和 形式 上 的 模型 、 效 率 ， 以 及 抽象 的 层次 。 这 两 份 
报告 的 主题 总 结 了 我 们 试图 在 本 书 中 提供 给 学 生 们 的 内 容 。 

本 书 由 斯 坦 福 大 学 一 门 课程 的 讲义 发 展 而 来 ， 该 课程 名 叫 “CS109: 计算 机 科学 导论 ” 
( CS109: Introduction to Computer Science )， 它 是 一 门 两 学 季 课 程 ， 有 很 多 目标 ， 第 一 个 目标 是 
为 计算 机 科学 专业 初学 者 的 进一步 学 习 打 下 坚实 的 基础 。 不 过 ， 计 算 科 学 在 大 量 的 理工 学 科 中 
变 得 越 来 越 重 要 。 因 此 ， 第 二 个 目标 是 为 那些 不 会 在 计算 机 科学 领域 进一步 深造 的 学 生 提 供 一 
些 该 领域 的 概念 性 工具 。 最 后 ， 影 响 更 加 广泛 的 目标 是 让 所 有 学 生 了 解 程序 设计 概念 ， 并 建立 
扎实 的 计算 机 科学 知识 基础 。 

本 书 第 一 版 于 1992 年 问世 , 是 基于 Pascal 语言 的 。 当 时 之 所 以 选择 Pascal 作为 示例 程序 
的 语言 ， 是 因为 计算 机 科学 科目 的 Advanced Placement” 考 试 使 用 了 Pascal 语言 ， 而 且 很 多 大 
学 的 程序 设计 导论 课程 也 是 使 用 Pascal 语言 。 我 们 欣喜 地 看 到 ， 上 自从 1992 年 起 ，C 语言 已 渐 
趋 成 为 主流 入 门 程序 设计 语言 ， 因 此 本 书 这 一 版 的 示例 程序 都 用 C 语言 写成 。 本 书 强调 抽象 
和 封装 的 重要 性 ， 这 应 该 能 为 读者 学 习 涉 及 使 用 C++ 的 面向 对 象 技术 的 后 续 课 程 提供 良好 的 
基础 。 

与 此 同时 ， 我 们 决定 对 本 书 的 内 容 进 行 两 大 改进 。 首 先 ， 虽 然 对 机 需 的 体系 结构 有 所 了 解 
有 利于 激发 对 度量 运行 时 间 的 兴趣 ， 但 我 们 发 现 几 乎 所 有 的 课程 体系 都 将 体系 结构 单独 作为 一 
门 课 程 ， 所 以 有 关 这 一 主题 的 章节 在 这 里 并 不 实用 。 其 次 ， 很 多 计算 理论 的 入门 课 程 会 强调 组 
合 和 概率 ， 所 以 我 们 决定 增加 这 方面 的 内 容 ， 并 将 其 单独 作为 一 章 。 

本 书 涵盖 的 主题 通常 会 出 现在 离散 数学 课程 以 及 大 二 计算 机 科学 的 数据 结构 课程 中 。 我 们 
有 意 从 计算 机 用 户 的 实际 需要 着 眼 ， 选 择 了 数学 方面 的 基础 知识 ， 而 不 是 从 数学 家 的 角度 去 选 
择 ， 并 沦 试 把 数学 基础 知识 与 计算 科学 有 效 地 结合 起 来 。 因 此 ， 我 们 和 希望 为 学 习 计 算 机 科学 的 
人 提供 一 种 比 学 习 程 序 设计 课程 、 离 散 数学 课程 或 计算 机 科学 附属 学 科 课程 更 佳 的 感 党 。 相 信 
随 着 时 间 的 推移 ， 科 学 家 和 工程 师 都 将 学 习 与 斯 坦 福 大 学 这 门 课程 类 似 的 基础 课程 。 这 样 的 计 
算 机 科学 课程 也 应 该 像 微 积 分 和 物理 学 的 相关 课程 那样 成 为 标准 课程 。 


























Q 简称 AP， 指 美国 高 中 开设 的 具有 大 学 水 平 的 课程 ， 即 大 学 预 修 课程 。AP 考试 的 成 绩 可 折 抵 大 学 学 分 ， 并 成 为 
美国 大 学 的 重要 录取 依据 。 一 一 编者 注 
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阅读 前 提 

从 大 一 新 生 到 研究 生 都 可 能 选修 基于 本 书 的 课程 。 这 里 我 们 假设 这 些 学 生 都 有 着 扎实 的 程 
序 设计 基础 ， 熟 悉 本 版 中 用 到 的 ANSI C 程序 设计 语言 。 特 别 要 说 的 是 ， 我 们 还 希望 学 生 们 了 
解 C 语 言 中 的 结构 ， 诸 如 递归 函数 、 结 构 体 、 指 针 ， 以 及 与 指针 和 结构 体 有 关 的 运算 符 ， 如 点 
运算 符 、-> 和 &。 
计算 机 科学 基础 课程 相关 建议 

本 书 以 传统 计算 机 科学 课程 的 方式 ,将 数据 结构 方面 的 初级 课程 ( 也 就 是 CS2 课程 ) 与 离 
散 数学 课程 结合 在 一 起 。 我 们 相信 ， 出 于 如 下 两 个 原因 ， 这 些 主题 的 整合 是 十 分 必要 的 。 

(1) 把 数学 与 计算 科学 更 加 紧密 地 联系 起 来 ， 有 助 于 激发 对 数学 的 兴 

(2) 计算 科学 与 数学 是 相辅相成 的 。 这样 的 例子 包括 , 第 2 章 中 递归 程序 设计 与 数学 归纳 法 
之 间 的 关系 , 第 14 章 ， 逻辑 学 中 自由 /约束 变量 的 区 别 与 程序 设计 语言 中 变量 范围 之 间 的 关系 。 
此 外 ， 与 启发 性 程序 设计 作业 有 关 的 建议 纵 贯 全 书 。 

本 书 的 使 用 方法 有 很 多 种 。 


两 学 季 或 两 学 期 的 课程 
斯 坦 福 大 学 的 CS109A-B 系列 课程 就 是 典型 的 两 学 季 课 程 ， 不 过 它们 的 安排 都 相当 紧 ， 各 


自 要 在 10 周 时 间 内 完成 40 个 课时 的 教学 ,这 两 门 课程 完整 涵盖 了 本 书 , 其 中 前 7 章 是 在 CS109A 
中 介绍 的 ， 而 第 8 至 14 章 是 在 CS109B 中 介绍 的 。 


一 学 期 的 CS2 类 课程 


本 书 也 可 以 用 于 一 学 期 课程 ， 内 容 与 CS2 课程 的 主题 类 似 。 本 书 中 的 内 容 确 实 太 多 ,一 个 
学 期 自然 讲 不 完 ， 因 此 我 们 建议 把 精力 放 在 以 下 这 些 内 容 上 。 

(1) 递归 算法 与 递归 程序 : 2.7 节 和 2.8 节 。 

(2) 大 O 分 析 和 程序 的 运行 时 间 : 第 3 章 ， 除 了 3.11 节 求 解 递 推 关系 的 内 容 。 

(G3) 树 : 52 市 ~~5.10 市 。 

(4) 表 : 第 6 章 。 有 人 可 能 希望 按照 更 为 传统 的 方式 ， 在 介绍 树 之 前 先 介 绍 表 。 我 们 在 这 里 
把 树 视 作 更 为 基础 的 概念 ， 不 过 这 样 调换 次 序 存 在 一 个 小 问题 ， 就 是 第 6 章 讨 论 的 “词典 ” 抽 
象 数 据 类 型 ( 以 及 插入 、 删 除 和 查找 操作 ), 在 5.7 节 中 就 作为 与 二 叉 查 找 树 相 关 的 概念 介绍 了 。 

(5) 集合 与 关系 : 7.2 节 一 7.9 节 以 及 8.2 节 一 8.6 节 ， 强 调 了 表示 集合 和 关系 的 数据 结构 。 

(6) 图 算法 : 9.2 节 一 9.9 节 。 


一 学 期 的 离散 数学 课程 


对 着 重 于 数学 基础 的 一 学 期 课程 而 言 ， 教 员 可 以 选择 介绍 以 下 内 容 。 
(1) 数学 归纳 法 和 递归 程序 : 第 2 章 。 

(2) 大 O 分 析 、 运 行 时 间 和 递 推 关系 : 3.4 市 ~~3.11 市 。 

(3) 组 合 学 : 4.2 节 一 4.8 节 。 

(4) 离散 概率 : 4.9 节 一 4.13 节 。 

(5) 树 的 数学 方面 : 5.2 节 一 $.6 节 。 





























(6) 集合 的 数学 方面 : 7.2 节 、7.3 节 、7.7 节 、7.10 节 和 7.11 节 。 
(7) 关系 代数 : 8.2 节 、8.7 节 和 8.9 市 。 

(8) 图 算法 与 图 论 : 第 9 章 。 

(9) 自动 机 和 正则 表达 式 : 第 10 章 。 

(10) 上 下 文 无 关 文 法 : 11.2 节 一 11.4 节 。 

(11) 命题 逻辑 和 谓词 逻辑 : 第 12 章 ,第 14 章 。 


本 书 特色 


为 了 帮助 学 生 学 习 这 些 知 识 ， 我 们 还 采取 了 以 下 辅助 措施 。 

(1) 每 章 开 头 都 有 内 容 简介 ， 最 后 都 有 小 结 ， 用 来 突出 本 章 要 点 。 

(2) 除了 在 市 标题 或 小 节 标 题 中 提 到 过 的 概念 和 定义 外 , 一些 重要 的 概念 和 定义 用 楷体 突出 
显示 。 

(3) 附注 栏 内 容 与 正文 分 隔 开 ， 这 些 附 注 短文 有 以 下 用 途 。 

口 有 一 些 是 对 正文 的 详细 阐述 ， 或 是 介绍 程序 或 算法 设计 的 微妙 之 处 。 

口 其 他 一 些 是 对 正文 中 要 点 的 总 结 或 强调 。 这 类 短文 包括 了 对 某 几 类 重要 证 明 〈 比如 各 种 

形式 的 归纳 证 明 ) 的 概述 。 

少量 用 于 举例 说 明 一 些 诬 误 ， 而 且 我 们 希望 将 其 与 正文 分 开 可 以 消除 可 能 出 现 的 误解 。 

口 少量 非常 简要 地 介绍 了 像 不 可 判定 性 或 计算 机 发 展 史 这 种 要 花 上 一 整 节 来 介绍 的 重要 

主题 。 

(4) 几乎 每 节 都 有 习题 ， 在 全 书 分 布 着 逾 1000 道 习 题 。 其 中 大 概 有 30% 标 记 了 一 个 星 号 ， 
表示 这 些 习 题 比 那些 不 带 星 号 的 要 多 费 一 番 思 量 。 还 有 约 10% 的 习题 标记 了 两 个 星 号 ， 它 们 是 
最 具 挑 战 性 的 。 

(5) 每 一 章 最 后 还 有 参考 文献 。 我 们 不 求 面 面 俱 到 ， 只 不 过 推荐 一 些 让 读者 能 了 解 与 该 章 主 
题 有 关 的 高 阶 教科 书 ， 以 及 那些 最 具 历 史 意 义 的 相关 论文 。 
封面 简介 

使 用 象征 图 书 内 容 的 漫画 或 图 片 作为 封面 是 计算 机 科学 教科 书 的 传统 。 本 书 用 凶 背 来 表示 
计算 机 科学 的 世界 ， 也 还 有 其 他 很 多 象征 符号 代表 着 那些 更 高 阶 计 算 机 科学 教科 书 ， 本 书 内 容 
正 是 为 这 些 书 打 基 础 的 ， 这 些 符号 有 下 面 这 些 。 
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计算 机 科学 : 将 抽象 机 械 化 


计算 机 科学 是 个 新 领域 ,不 过 它 几乎 已 经 触及 人 类 工作 的 每 个 方面 。 计 算 机 、 信 息 系 统 、 
文本 编辑 融 、 电 子 表格 的 普及 ， 以 及 使 得 计算 机 更 便于 使 用 、 人 们 生产 效率 的 精彩 应 用 程序 的 
激增 ， 都 显示 出 计算 机 科学 对 社会 的 影响 。 该 领域 有 个 重要 的 部 分 ， 涉 及 如 何 让 程序 设计 更 容 
易 以 及 让 软件 更 可 靠 。 不 过 从 根本 上 讲 ， 计 算 机 科学 是 一 门 抽 痕 的 科学 ， 它 为 人 们 思考 问题 以 
及 找到 适当 的 机 械 化 技术 解决 问题 而 建立 模型 。 

其 他 科学 是 顺 其 自然 地 研究 宇宙 i。 例 如 ， 物 理学 家 的 工作 就 是 理解 世界 是 如 何 运转 的 ， 而 
不 是 去 创造 一 个 用 物理 定律 能 更 好 地 理解 的 世界 。 而 计算 机 科学 家 则 必须 抽象 现实 世界 中 的 问 
题 ， 使 其 既 可 以 为 计算 机 用 户 所 理解 ， 又 可 以 在 计算 机 内 加 以 表示 和 操作 。 

进行 抽象 的 过 程 有 时 很 简单 。 例 如 ， 我 们 能 熟练 地 用 “命题 逻辑 ”这 种 抽象 方式 ， 为 制造 
计算 机 所 使 用 的 电子 电路 的 行为 建 模 。 通 过 逻辑 表达 式 进行 的 电路 建 模 是 不 准确 的 ， 它 简化 了 
或 者 说 是 抽象 掉 了 很 多 细节 ， 比 如 电子 流 经 电路 和 门 所 花 的 时 间 。 然 而 ,命题 逻辑 模型 已 经 足 
够 帮助 我 们 顺利 设计 计算 机 电路 了 。 我 们 将 在 第 12 草 中 更 多 地 探讨 命题 逻辑 。 

再 举 个 例子 ， 假 设 我 们 要 为 各 种 课程 的 期 末 考 试 排 定时 间 。 也 就 是 说 ,我 们 必须 为 各 门 诬 
程 的 考试 指定 时 段 ， 只 有 在 没有 学 生 同 时 选择 菜 两 门 读 程 的 前 提 下 ， 才 将 这 两 门 谍 程 的 考试 安 
排 在 同一 时 段 。 如 何 为 这 一 问题 建 模 ， 起 初 可 能 不 太 好 确定 。 一 种 方式 是 为 每 门 课程 夯 一 个 称 
为 节点 (node ) 的 圆 ， 如 果 有 学 生 同 时 选择 了 两 门 课程 ， 就 画 一 条 线 来 连接 相应 的 两 个 节点 ， 
这 条 线 称 为 边 ( edge )。 图 1-1 表 示 了 5 门 课程 可 能 的 关系 图 ， 这 幅 图 就 是 课程 冲突 图 。 
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图 1-1 5 门 课程 的 课程 冲突 图 ， 两 门 课程 之 间 的 边 表示 至 少 有 一 个 学 生 同 时 选择 了 这 
两 门 课程 
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有 了 课程 冲突 图 ,我们 就 可 以 通过 在 图 中 反复 找 出 并 删除 “最 大 独立 集 ” 来 解决 考试 安排 
问题 。 独 立 集 是 没有 边 相 连接 的 节点 的 集合 。 如 果 不 能 再 向 茶 独 立 集 添加 图 中 的 其 他 节点 了 ， 
那么 就 说 这 个 独立 集 是 最 大 独立 集 。 即 , 一 个 图 中 包含 节点 数目 最 多 的 独立 集 称 为 最 大 独立 集 。 
在 说 课程 时 ,最 大 独立 集 就 是 指 没有 共同 学 生 的 课程 的 最 大 集合 。 在 图 1-1 中 ,| 经 济 学 , 英语， 
物理 | 就 是 一 个 最 大 独立 集 。 最 大 独立 集中 的 这 些 课程 被 指定 到 第 一 个 时 段 。 

我 们 从 图 中 删除 第 一 个 最 大 独立 集中 的 节点 以 及 这 些 节 点 附带 的 边 ， 接 着 在 剩 下 的 课程 中 
找 出 最 大 独立 集 。 下 一 个 可 选 的 最 大 独立 集 是 单元 素 集 | 计算 机 科学 |。 这 个 最 大 独立 集中 的 诬 
程 便 被 分 配 到 第 二 个 时 段 。 

如 此 重复 找 出 并 删除 最 大 独立 集 ， 直 到 课程 冲突 图 中 不 再 有 任何 节点 。 至 此 ， 所 有 课程 都 
已 经 被 分 配 到 各 时 段 中 。 本 例 中 ， 在 两 次 迭代 之 后 ， 课 程 冲突 图 中 就 只 剩 下 数学 三 点 了 ， 而 它 
就 组 成 了 最 后 一 个 最 大 独立 集 ， 将 被 指定 到 第 三 个 时 段 中 。 形 成 的 考试 排 期 如 下 : 




















时 自 课程 考试 
1 经 济 学 ， 英 语 ， 物 理 
2 计算 机 科学 
3 数学 


这 一 算法 不 见得 会 将 各 门 需 要 考试 的 课程 分 布 在 数目 尽 可 能 少 的 时 段 中 ， 不 过 它 很 简单 ， 
而 且 生 成 的 时 间 安 排 中 所 会 的 时 段 数 目 往 往 接近 最 小 值 。 利 用 第 9 章 介 绍 的 技术 , 它 也 很 容易 被 
设计 成 计算 机 程序 。 

请 注意 ,这 种 方式 会 将 一 些 可 能 很 重要 的 问题 细节 抽象 掉 。 例 如 ,， 它 可 能 会 让 某 个 学 生 在 5 
个 连续 的 时 段 内 参加 5 科 考 试 。 也 许 我 们 可 以 建立 这 样 一 个 模型 ， 对 某 个 学 生 一 次 可 能 连续 参加 
考试 的 科目 数 加 以 限制 ， 不 过 这 样 一 来 ， 建 立 的 模型 和 考试 安排 问题 的 解决 方案 都 可 能 变 得 更 
加 复杂 。 





抽象 : 不 用 担心 


读者 可 能 会 对 “抽象 ”这 个 词 有 所 忌 悦 ,因为 我 们 都 有 这 样 一 种 直觉 : 抽象 的 东西 都 是 难 
以 理解 的 。 例 如， 人们 一 般 会 认为 抽象 代数 ( 研究 群 、 环 ,诸如 此 类 ) 要 比 高 中 时 学 的 代数 难 。 
然而 , 我 们 所 使 用 的 抽象 意味 着 简化 ,是 将 现实 中 复杂 而 详细 的 情景 蔡 换 为 解决 问题 所 使 用 的 
可 理解 模型 。 也 就 是 说 ,我们 将 那些 对 解决 问题 而 言 影响 其 微 或 根本 没有 影响 的 细节 “抽象 掉 ” 
了 ， 从 而 建立 一 个 让 我 们 能 处 理 问题 实质 的 模型 。 





通常 情况 下 ， 找 到 好 的 抽象 方式 是 相当 困难 的 ， 因 为 计算 机 能 执行 的 任务 有 限 ， 执 行 速度 
也 有 限 。 在 计算 机 科学 的 初期 阶段 ， 一 些 乐观 主义 者 认为 机 器 人 很 快 就 能 像 《 星 球 大 战 》 中 的 
C3PO 机 禹 人 那样 神通 广大 。 自 那 时 起 , 我 们 已 经 了 解 到 , 要 让 计算 机 (或 机 器 人 ) 具有 “智能 ” 
行为 ， 就 需要 为 计算 机 提供 一 个 本 质 上 跟 人 类 所 文 配 的 世界 一 样 详细 的 模型 ， 不 仅 要 包括 事实 
(“ 陛 莉 的 电话 号 码 是 555-1234”)， 还 要 包括 原则 和 关系 (“如 果 抛 出 某 物体 ， 它 通常 会 回 下 
坠落 ”)。 

我 们 在 “知识 的 表示 ”这 一 问题 上 已 经 取得 了 很 大 的 进步 ， 设 计 出 了 一 些 抽 象 方式 ， 可 用 
来 构建 进行 某 类 推理 的 程序 。 有 向 图 便 是 这 种 抽象 的 一 个 例子 , 它 用 节点 表示 实体 (“ 猫 ” 或 “ 松 
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毛 ”)， 用 从 一 个 节点 指 回 另 一 个 节点 的 箭头 〈 称 为 绝 ) 代表 关系 (“ 松 毛 是 只 猫 "，“ 猎 是 动物 ”， 
“ 松 毛 的 牛奶 碟子 归 松 毛 所 有 ”)， 图 1-2 就 展示 了 这 样 一 幅 图 。 


是 
是 








图 1-2 ”这 幅 图 用 于 表示 与 “ 松 毛 ”相关 的 知识 


另 一 种 实用 的 抽象 是 形式 逻辑 ， 它 让 我 们 可 以 运用 推理 规则 推导 事实 ， 比 如 “如 果 X 是 只 
猫 ，7 是 X 的 母亲 ， 那 么 7 是 只 猫 ”。 不 过 ， 为 现实 世界 或 其 关键 部 分 建 模 (或 者 说 是 对 其 进行 抽 
象 ) 的 过 程 ， 却 仍 是 计算 机 科学 所 面临 的 一 大 挑战 ， 是 近期 没 法 彻底 解决 的 。 


1.1 本 书 主要 内 容 


本 书目 标 读 者 应 当 具 有 一 定 的 ANSIC 语 言 程 序 设计 实践 经 验 , 本 书 旨 在 为 这 些 读者 介绍 计 
算 机 科学 的 基本 概念 和 重点 内 容 。 书 中 强调 了 如 下 三 种 重要 的 问题 解决 工具 。 

(1) 数据 模型 。 数 据 特征 的 抽象 ， 用 来 描述 问题 。 我 们 已 经 提 到 了 两 种 模型 : 逻辑 和 图 ， 而 
在 本 书 中 还 会 看 到 很 多 其 他 的 模型 。 

(2) 数据 结构 。 用 来 表示 数据 模型 的 编程 语言 结构 。 例 如 ，C 语 言 提 供 了 内 置 的 抽象 ， 比 如 
结构 和 指针 ， 使 我 们 能 够 构建 数据 结构 ， 表 示 像 图 这 类 的 复杂 抽象 。 

(3) 算法 。 操 作用 数据 模型 抽象 、 数 据 结构 等 形式 表示 的 数据 ， 从 而 获取 解决 方案 的 技术 。 


1.1.1 数据 模型 


我 们 在 两 种 情况 下 会 提 到 数据 模型 。 像 本 章 开 头 讨论 的 图 这 样 的 数据 模型 ， 是 常用 于 协助 
形成 问题 解决 方案 的 抽象 。 我 们 还 会 在 本 书 中 了 解 多 种 这 样 的 数据 模型 ， 比 如 第 5 章 介绍 的 树 、 
第 6 草 介 绍 的 表 、 第 7 章 介 绍 的 集 、 第 8 章 介 绍 的 关系 、 第 9 章 介 绍 的 图 、 第 10 章 介绍 的 有 限 自 动 
机 、 第 11 章 介绍 的 语法 ， 以 及 第 12 章 和 第 14 章 介绍 的 逻辑 。 

数据 模型 还 与 编程 语言 及 计算 机 相关 。 比 如 ，C 语 言 的 数据 模型 就 包含 诸如 字符 、 多 种 长 
度 的 整数 以 及 浮 点 数 这 类 的 抽象 。C 语 言 中 的 整数 和 浮 点 数 只 是 数学 意义 上 整数 和 实数 的 近似 
值 ， 因 为 计算 机 所 能 提供 的 算术 精度 是 有 限 的 。C 语 言 数 据 模型 还 包括 结构 、 指 针 和 函数 这 样 
的 类 型 ， 我 们 将 在 1.4 节 中 详细 介绍 。 
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1.1.2 ”数据 结构 


当 手 头 问 题 的 数据 模型 不 能 直接 用 编程 语言 内 置 的 数据 模型 表示 时 ， 我 们 就 必须 使 用 该 语 
言 所 支持 的 抽象 来 表示 所 需 的 数据 模型 。 为 此 ， 我 们 研究 了 数据 结构 ， 将 编程 语言 中 没有 显 式 
包含 的 抽象 ， 以 该 语言 的 数据 模型 表示 出 来 。 不 同 的 编程 语言 可 能 有 着 大 不 相同 的 数据 模型 。 
例如 ， 与 C 语 言 不 同 ，Lisp 语 言 直接 文 持 树 ， 而 Prolog 语 言 则 内 置 了 逻辑 数据 模型 。 

1.1.3 ”算法 

算法 是 对 可 机 械 执行 的 一 系列 步骤 精准 而 明确 的 规范 。 用 来 表示 算法 的 可 以 是 任何 一 种 可 
被 党 人 理解 的 语言 ， 不 过 在 计算 机 科学 领域 ， 算 法 多 用 编程 语言 正式 地 表现 为 计算 机 程序 ， 或 
用 编程 语言 混合 英语 语句 的 非 正 式 风格 来 表示 。 大 家 在 学 习 编 程 时 很 可 能 已 经 遇 到 过 一 些 重要 
算法 。 例 如 ， 有 不 少 为 数组 元 素 排 序 的 算法 ， 就 是 按照 从 小 到 大 的 顺序 排列 数组 元 素 。 有 一 些 
诸如 二 又 查找 (binary searching ) 之 类 的 查找 算法 很 巧妙 ， 可 以 通过 反复 将 某 给 定 元 素 在 数组 
中 可 能 出 现 的 部 分 对 半 划 分 ， 迅 速 地 找到 这 个 元 素 。 

这 些 算法 以 及 其 他 一 些 解 决 和 常规 问题 的 “招数 ”, 是 计算 机 科学 家 们 在 设计 程序 时 会 用 到 的 
工具 。 我 们 将 在 本 书 中 学 习 诸多 此 类 技巧 ， 包 括 重 要 的 排序 和 查找 方法 。 此 外 ， 我 们 还 要 了 解 
使 一 种 算法 优 于 其 他 算法 的 因素 。 很 多 时 候 ， 运 行 时 间 〈running time )， 或 者 说 算法 处 理 输入 
所 花 的 时 间 ， 是 算法 “质量 ”的 重要 一 环 ， 我 们 会 在 第 3 章 中 讨论 。 

算法 的 其 他 方面 也 很 重要 ， 特 别 是 简易 性 。 理 想 情况 下 ， 算 法 应 该 易于 理解 ， 并 易于 转变 
成 可 运转 的 程序 。 而 且 ， 慌 得 相应 知识 的 人 在 阅读 了 实现 该 算法 的 代码 后 ， 应 该 能 理解 由 该 算 
法 转变 而 来 的 程序 。 不 过 快速 和 简易 往往 是 不 能 两 全 的 ， 所 以 我 们 必须 要 明智 地 选择 算法 。 


1.1.4 基本 思路 


在 进一步 阅读 本 书 的 过 程 中 ， 我 们 将 遇 到 一 些 重 要 的 统一 原则 。 在 这 里 要 提 以 下 两 点 。 

(1) 设计 代数 。 在 底层 模型 得 到 充分 了 解 的 某 些 领域 ， 我 们 可 以 提出 一 些 表示 法 ， 以 便 表 
示 和 评价 某 些 折衷 的 设计 方案 。 通 过 这 样 的 认识 ,我 们 可 以 提出 一 些 设计 理论 以 构建 出 设计 良 
好 的 系统 。 命 题 逻 辑 ， 加 上 第 12 章 中 的 布尔 代数 这 种 相关 的 表示 法 ， 就 是 设计 代数 的 一 个 好 例 
子 。 有 了 它 ， 我 们 可 以 为 数字 计算 机 中 的 子 系统 设计 高 效 的 电路 。 其 他 设计 代数 的 例子 还 包括 
第 7 章 中 的 集 代 数 、 第 8 章 中 的 关系 代数 ， 以 及 第 10 草 中 的 正则 表达 式 代数 。 

(2) 递归 。 作 为 一 种 可 用 来 定义 概念 和 解决 问题 的 实用 技术 ， 递 归 特 别 值得 一 提 。 我 们 会 
在 第 2 章 中 详细 讨论 递归 , 本 书后 续 内 容 中 也 会 反复 用 到 它 。 每 当 我 们 需要 精确 地 定义 对 象 , 或 
需要 解决 问题 时 ,都 应 该 问 一 问 :“ 递 归 解 决 方案 应 当 是 什么 样子 呢 ? ”递归 方案 的 简易 和 效率 
常 使 其 成 为 最 优 方法 。 


1.2 ”本 章 主要 内 容 


本 章 接 下 来 的 部 分 将 为 计算 机 科学 的 学 习 做 好 铺垫 ， 要 介绍 以 下 主要 概念 。 
口 数据 模型 ( 1.3 节 )。 

口 C 语 言 的 数据 模型 (1.4 节 )。 

口 软件 开发 流程 的 主要 步骤 (1.5 节 )。 
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我 们 会 介绍 一 些 例子 ， 讲 讲 抽象 和 模型 出 现在 计算 机 系统 的 几 种 方式 。 其 中 特别 提 到 了 编 
程 语言 中 的 模型 、 特 定 系统 程序 ( 比如 操作 系统 ) 中 的 模型 ， 以 及 计算 机 所 使 用 电路 中 的 模型 。 
由 于 软件 是 当今 计算 机 系统 的 重要 组 成 部 分 ， 因 此 我 们 需要 理解 软件 开发 流程 、 模 型 和 算法 扮 
演 的 角色 ， 以 及 软件 开发 中 计算 机 科学 只 能 以 有 限 方式 解决 的 那些 方面 。 

在 1.6 节 中 会 介绍 一 些 常 规定 义 ， 它 们 在 全 书 的 C 语 言 程序 中 都 将 用 到 。 


1.3 ”数据 模型 


任何 数学 概念 都 可 称 为 数据 模型 。 而 在 计算 机 科学 领域 , 数据 模型 通常 包含 以 下 两 个 方面 。 

(1) 对 象 可 以 采用 的 值 。 例 如 ,很 多 数据 模型 包含 具有 整数 值 的 对 象 。 数 据 模型 的 这 个 方面 
是 静态 的 ， 它 告诉 我 们 对 象 能 接受 哪些 值 。 编 程 语言 数 据 模 型 的 这 一 静态 部 分 通常 被 称 为 类 型 
系 统 ,。 

(2) 数据 的 运算 。 例如 , 我 们 常常 会 对 整数 执行 加 法 这 样 的 运算 ,模型 的 这 一 方面 是 动态 的 ， 
它 告诉 我 们 改变 值 和 创建 新 值 的 方式 。 


1.3.1 编程 语言 数据 模型 


每 种 编程 语言 都 有 目 己 的 数据 模型 ， 这 些 数据 模型 互 不 相同 ， 而 且 通 常 有 相当 大 的 差异 。 
多 数 编程 语言 处 理 数据 所 遵循 的 基本 原则 是 ， 每 个 程序 都 可 以 访问 我 们 用 于 表示 存储 区 域 的 
“ 框 ?。 每 个 框 都 具有 一 个 类 型 ， 比 如 int 或 char。 框 中 可 以 存储 类 型 对 应 的 值 ， 通 常 将 可 以 存 
储 到 这 些 框 中 的 值 称 为 数据 对 象 。 

我 们 还 要 为 这 些 框 命名 。 一 般 来 说 ， 框 的 名 称 可 以 是 任何 指示 该 框 的 表述 性 词语 。 我 们 通 
常会 将 框 的 名 称 视 作 该 程序 的 变量 ， 不 过 情况 并 非 完 全 如 此 。 例 如 ， 如 果 x 是 递归 函数 的 局 部 
变量 , 那么 就 可 能 会 有 很 多 名 为 x 的 框 ， 每 个 x 都 与 对 F 的 不 同调 用 相关 联 。 这 样 的 话 ， 这 种 框 的 
真实 名 称 就 是 x 与 对 F 的 某 次 调用 的 组 合 。 

C 语 言 中 的 多 数 数据 类 型 都 是 我 们 熟悉 的 : 整数 、 浮 点 数 、 字 符 、 数 组 、 结 构 和 指针 。 这 
些 都 是 静态 的 概念 。 

可 以 对 数据 进行 的 操作 包括 整数 和 浮 点 数 的 常规 算术 运算 、 数 组 或 结构 元 素 的 存 取 操 作 ， 
以 及 指针 的 解 引 用 ( 也 就 是 找到 指针 所 指向 的 元 素 )。 这 些 运算 都 只 是 C 语 言 数 据 模型 动态 部 分 
的 一 部 分 。 

在 程序 设计 课程 中 ， 我 们 可 能 会 看 到 C 语 言 中 不 包括 的 重要 数据 模型 ， 比 如 表 、 树 和 图 。 
用 数学 语言 来 讲 ， 表 就 是 可 以 写成 (a1, az ,… , a) 这 种 形式 的 n 个 元 素 组 成 的 序列 ， 其 中 是 第 一 
个 元 素 ，as 是 第 二 个 ， 以 此 类 推 。 表 的 运算 包含 插入 新 元 素 、 删 除 元 素 ， 以 及 拼接 表 ( 也 就 是 
将 一 个 表 追 加 到 为 一 表 的 末端 )。 


+ 示例 1.1 

在 C 语 言 中 ， 整 数 表 可 以 用 链表 这 种 数据 结构 表示 ， 表 的 元 素 被 存储 在 链表 的 节点 中 。 链 
表 及 其 节点 可 用 如 下 类 型 声明 定义 。 

typedef struct CELL *LIST; 

struct CELL +{ 


Int element,; 
struct LIST next; 



























































}; 
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该 声明 定义 了 有 着 两 个 字段 的 自 引 用 结构 cELL。 第 一 个 字段 是 element， 存 放 着 表 中 元 
素 的 值 ， 而 且 其 类 型 为 int。 

每 个 CELIL 的 第 二 个 字段 是 next ， 存 放 着 指向 节点 的 指针 。 请 注意 ，LIST 类 型 其 实 是 指 回 
CELL 的 指针 。 因 此 ，CELL 类 型 的 结构 可 以 通过 它们 的 next 字 上 段 链 接 起 来 ,构成 我 们 通常 所 说 
的 链表 ， 如 图 1-3 所 示 。next 字 上 段 既 可 以 被 视 为 指向 下 一 个 节点 的 指针 ， 也 可 以 代表 从 某 节 点 
起 的 整 段 链表 。 同 理 ， 整 个 链表 也 可 以 用 指向 链表 第 一 个 单元 的 LIST 类 型 的 指针 表示 。 


图 1-3 表示 表 (ai， Us qa)) 的 链表 


单元 是 用 长 方形 表示 的 ， 其 左边 部 分 表示 元 素 ， 右 边 部 分 存放 指针 〈 表示 为 指向 下 一 个 单 
元 的 箭头 )。 存 放 指针 的 方 框 中 的 点 表示 该 指针 为 NULL 。 第 6 章 将 更 详细 地 介绍 表 。 








数据 模型 与 数据 结构 


尽管 名 称 类 似 , 但 “ 表 ” 和 “链表 ” 却 是 非常 不 同 的 概念 。 表 是 种 数学 抽象 ， 或 者 说 是 数 
据 模 型 。 而 链表 则 是 种 数据 结构 ， 是 通常 用 于 C 语 言及 相似 语言 中 的 数据 结构 ， 用 来 表示 程序 
中 的 抽象 表 。 而 有 些 编程 语言 则 不 需要 用 数据 结构 来 表示 抽象 表 , 例如 , 表 (q1,a2,… , as) 在 Lisp 
语言 中 可 以 直接 表示 为 [al, 4q;,… , 4,|]， 而 在 Prolog 语 言 中 也 可 以 表示 为 类 似 形式 。 





1.3.2 ”系统 软件 的 数据 模型 


数据 模型 不 仅 存 在 于 编程 语言 中 , 而 且 存 在 于 操作 系统 和 应 用 程序 中 。 大 家 可 能 熟悉 UNIX 
或 MS-DOS 这 样 的 操作 系统 ， 也 可 能 熟悉 Microsoft Windows。?2 操 作 系 统 的 功能 是 管理 和 调度 计 
算 机 的 资源 。 像 UNIX 这 样 的 操作 系统 ， 其 数据 模型 具有 文件 、 目 录 和 进程 这 样 的 概念 。 

(1) 数据 本 身 存储 在 文件 中 ， 在 UNIX 系 统 中 ， 文 件 都 是 字符 串 和 字符 。 

(2) 文件 被 组 织 成 目录 ， 目录 就 是 文件 和 (或 ) 其 他 目录 的 集合 。 目 录 和 文件 形成 了 树 形 结 
构 ， 而 文件 处 在 树叶 的 位 置 *。 图 1-4 中 的 树 可 以 表示 UNIX 操 作 系 统 的 目录 结构 。 目 录 是 用 圆圈 
表示 的 。 根 目录 /包含 名 为 mnt 、usr、bin 等 的 目录 。 目 录 /usr 含 有 目录 ann 和 bob， 而 目录 
ann 下 含有 3 个 文件 : al1 、a2 和 a3。 

(3) 进程 是 指 程序 的 独立 执行 。 进 程 接 受 流 作为 输入 ,并 产生 流 作为 输出 。 在 UNIX 系 统 中 ， 
进程 可 以 通过 管道 连接 ， 让 一 个 进程 的 输出 作为 下 一 个 进程 的 输入 。 这 种 进程 组 合 可 看 作 有 着 
自己 输入 输出 的 独立 进程 。 

















J NULL 是 标准 头 文件 staio.h 中 定义 的 符号 常量 ， 用 来 表示 未 指向 任何 内 容 的 指针 的 值 。 本 书 中 的 NULL 指 针 都 
作 此 义 解释 。 

Q 如 果 对 操作 系统 不 熟悉 ， 那 么 可 以 跳 过 下 面 几 个 段落 。 不 过 大 多 数 读者 都 应 该 接触 过 操作 系统 ， 可 能 只 是 称呼 
不 同 。 例 如 ，Macintosn“ 系 统 ” 就 是 一 种 操作 系统 ， 只 是 使 用 了 不 同 的 术语 。 例 如 ， 在 苹果 用 语 中 ， 目 录 就 被 
称 为 “文件 夹 ”。 

@) 不 过 ， 目 录 中 的 “链接 ”可 能 会 让 某 个 文件 或 目录 看 起 来 像 是 几 个 不 同 目录 的 一 部 分 。 
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al a2 a3 ek b2 


图 1-4 具有 代表 性 的 UNIX 目 录 / 文 件 结构 


+ 示例 1.2 

想 想 如 下 UNIX 命 令 行 。 

bc | word | speak 

符号 | 表示 管道 ， 该 操作 使 符号 左边 进程 的 输出 成 为 符号 右边 进程 的 输入 。 程 序 pc 是 果 面 
计算 器 ， 接 受 算术 表达 式 〈 例 如 2+3 ) 作为 输入 ,并 生成 答案 5 作为 输出 。 程 序 word 用 来 将 数字 
转换 成 单词 ， 而 speak 则 将 单词 转换 成 音素 序列 ， 接 痢 通 过 扬 声 吉 将 语音 合成 大 合成 的 声音 播 
放出 来 。 这 三 个 程序 通过 管道 连接 起 来 , 使 这 条 UNIX 命 令 行 成 为 了 一 个 进程 , 并 表现 为 一 个 “会 
说 话 的 ”桌面 计算 顺 。 它 接受 算术 表达 式 作 为 输入 ， 并 产生 说 出 来 的 答案 作为 输出 。 本 示例 还 
可 以 说 明 ， 将 复杂 的 任务 处 理 成 多 个 简单 功能 的 组 合 ， 实 现 起 来 可 能 会 更 加 简单 。 

操作 系统 还 有 其 他 许多 方面 ， 比 如 它 如 何 控制 数据 安全 以 及 与 用 户 的 互动 。 不 过 ， 即 便 是 
通过 这 些 简单 的 观察 ， 也 应 该 很 容易 看 出 ， 操 作 系统 的 数据 模型 和 编程 语言 的 数据 模型 是 相当 
不 同 的 。 

文本 编辑 硕 中 有 另 一 种 数据 模型 。 文 本 编辑 需 的 每 种 数据 模型 都 结合 了 文本 字符 串 的 表示 
和 对 文本 的 编辑 操作 。 这 种 数据 模型 通常 会 包含 行 的 概念 ， 行 和 多 数 文件 一 样 ， 就 是 字符 串 。 
不 过 ， 与 文件 不 同 的 是 , 行 可 能 有 着 与 其 相关 联 的 行 号 。 行 还 可 能 被 组 织 成 更 大 的 单元 ( 比如 
段落 )， 而 且 对 行进 行 的 操作 通常 适用 于 行内 的 任何 位 置 ， 而 不 会 像 多 数 常 见 的 文件 操作 那样 ， 
只 是 对 前 部 进行 操作 。 一 般 的 文本 编辑 需 会 文 持 “当前 ” 行 〈《 光 标 所 在 的 那 一 行 ) 的 概念 ， 还 
可 能 支持 行内 当前 位 置 的 概念 。 文 本 编辑 带 执 行 的 操作 包括 对 行 的 多 种 修改 ， 比 如 在 行内 删除 
或 搬入 字符 、 删 除 行 ， 以 及 创建 新 行 。 在 一 般 的 文本 编辑 器 中 还 可 以 在 已 编辑 文件 的 行 中 搜索 
特定 的 字符 串 。 

其 实 ， 如 果 看 看 其 他 熟悉 的 软件 ， 比 如 电子 表格 或 视频 游戏 ， 就 会 发 现 ， 每 个 调用 程序 都 
必须 遵守 被 调用 程序 的 数据 模型 。 我 们 见 到 的 各 种 数据 模型 通 稼 彼此 间 截 然 不 同 ， 无 论 是 用 来 
表示 数据 的 原 语 ， 还 是 向 用 户 提 供 的 数据 操作 方式 ， 全 都 不 同 。 而 且 各 数据 模型 都 是 通过 数据 
结构 和 使 用 它们 的 程序 ， 用 某 种 编程 语言 实现 的 。 


1.3.3 ”电路 的 数据 模型 


在 本 书 中 我 们 还 会 看 到 计算 机 电路 使 用 的 数据 模型 。 这 种 模型 就 是 命题 逻辑 ， 在 计算 机 设 
计 中 是 最 实用 的 。 计 算 机 是 由 称 为 门 的 基本 元 件 组 成 的 。 每 个 门 都 有 着 一 个 或 多 个 输入 以 及 一 
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个 输出 ， 输 入 或 输出 的 值 只 能 是 0 或 1。 门 具有 一 个 简单 的 功能 ， 比 如 AND 运 算 〈 与 运算 )， 就 
是 如 果 所 有 输入 为 1， 那 么 输出 就 是 1， 而 如 果 至 少 有 一 个 输入 为 0， 那 么 输出 就 是 0。 从 某 个 抽 
象 层次 来 讲 ， 计 算 机 设计 就 是 选择 如 何 连接 门 来 执行 计算 机 基本 运算 的 过 程 。 当 然 也 存在 其 他 
很 多 与 计算 机 设计 相关 的 抽象 层次 。 

图 1-5 展 示 了 常见 的 与 门 符号 以 及 对 应 的 真 值 表 , 该 表 指 明了 每 对 输入 值 搭配 经 过 该 门 产生 
的 输出 值 "。 我 们 将 在 第 12 章 中 介绍 真 值 表 ， 并 在 第 13 章 中 介绍 门 及 门 的 互相 连接 。 











图 1-5 与 门 及 其 真 值 表 


+ 示例 1.3 

执行 C 语 言 赋值 语句 a=b+tc, 计算 机 会 使 用 加 法 电路 执行 加 法 运算 。 在 计算 机 中 ,所 有 数 
字 都 是 以 二 进 制 的 形式 ,使 用 0 和 1 这 两 个 数字 ( 叫 作 二 进 制 数字 ,或 简称 位 ) 表示 的 。 二 进 
制 加 法 计算 也 遵守 十 进 制 加 法 的 法 则 ， 从 右 端的 数字 开始 相 加 ， 如 果 产 生 进 位 ， 就 将 进位 加 
到 右 起 第 二 位 上 ， 如 果 这 一 位 上 相 加 的 结果 还 产生 进位 ， 就 继续 加 到 右 起 第 三 位 上 ， 以 此 类 
推 。 

我 们 可 以 用 几 个 门 来 组 建 一 位 加 法 器 (one-bit adder ) 电路 ， 如 图 1-6 所 示 。 两 个 输入 位 x 和 
y， 一 个 进位 输入 位 ec， 经 过 相 加 ， 形 成 一 个 和 值 位 z:， 以 及 进位 输出 位 4。 更 精确 地 讲 ， 如 图 1-7 
所 示 ， 如 果 c、x 和 y 中 有 不 少 于 两 个 的 值 为 1， 那 么 4 的 值 就 是 1， 而 如 果 c、x 和 y 中 有 奇数 个 (1 
个 或 3 个 ) 的 值 为 1， 那 么 z 的 值 就 是 1。 进 位 输出 位 后 面 跟 上 和 值 位 ( 即 qz ) 就 形成 了 一 个 两 位 
的 二 进 制 数 ， 这 就 是 x、y 和 和 c 为 1 时 的 总 值 。 在 这 种 情况 下 ， 这 个 一 位 加 法 融 就 完成 了 输入 的 相 
加 运算 。 











Zz 


图 1-6 一 位 加 法 器 : qz 是 x+y+c 的 和 


J 请 注意 ， 寿 我 们 将 1 视 为 “ 真 *"， 将 0 视 为 “ 假 ”， 则 与 门 执行 的 是 和 C 语 言 中 && 运 算 符 相 同 的 逻辑 运算 。 
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> d 2 
0 0 0 0 0 
0 0 1 0 1 
OL 0 0 1 
0 1 1 1 0 
1 0 0 0 1 
1 0 1 1 0 
TF 0 1 0 
| | 1 1 
图 1-7 一 位 加 法 絮 的 真 值 表 
行 波 进位 加 法 算法 


在 进行 十 进 制 数 的 加 法 时 ， 我们 都 使 用 过 行 波 进位 算法 。 拿 456+829 举 例 ， 相 加 的 步 
该 如 下 所 示 。 


Oo 上 心 
NP SC 一 
Oo 上 必 己 


6 
9 
5 


oI 
SU 个 


也 就 是 说 , 第 一 步 , 我 们 会 将 最 右边 的 位 相 加 , 6+9=15。 记 下 5, 并 将 进位 1 放 到 第 二 列 。 
第 二 步 ， 我 们 将 进位 输入 1 与 右 起 第 二 位 的 两 个 数字 相 加 ， 得 到 1 +5+2=8。 记 下 8， 进位 是 0。 
第 三 步 ， 将 进位 输入 0， 与 右 起 第 三 位 上 的 数字 相 加 ， 得 到 0+4+8=12。 记 下 2， 由 于 我 们 已 
经 计算 到 了 最 左边 的 位 ， 因 此 就 不 将 1 进位 ， 而 是 将 其 作为 结果 中 最 左边 的 一 位 。 

二 进 制 和 es 进位 和 要 相 加 的 “数字 ” 
要 么 是 0， 要 么 是 1。 因 此 一 位 加 法 器 完整 地 描述 了 单个 数位 上 的 加 法 表 。 也 就 是 说 ， 如 果 三 个 
位 都 是 0(， 那 么 a 就 记 下 0 以 及 进位 0。 如 果 三 个 位 中 有 一 个 是 1， 那 么 和 就 是 1， 就 记 下 
MG NR 也 就 是 二 进 制 数 10， 就 记 下 0 以 及 进位 1。 
人 是 1， 那 么 和 就 是 3， 也 就 是 二 进 制 数 11， 就 记 下 1 及 进位 1。 伍 如， 用 行 波 进位 加 
法 将 二 证 101 和 1 各 的 节操 下 所 下 


ER 


2 
I 


OI 
ely Ne em 
Ol 





很 多 计算 机 用 32 位 数字 来 表示 整数 。 所 以 加 法 融 电 路 可 由 32 个 一 位 加 法 带 组 合 而 成 ， 如 图 
1-8 所 示 。 该 电路 通常 称 为 行 波 进位 加 法 器 ， 因 为 进位 是 从 右 问 左 一 次 一 位 行进 的 。 要 注意 ,最 
右 侧 ( 最 低位 ) 一 位 加 法 需 的 进位 总 是 0。 位 序列 x31x30…xo 表 示 一 个 加 数 ， 而 y31y30…yo 则 表示 男 
一 个 加 数 。 和 就 是 dzslzso…zo， 也 就 是 说 ， 和 的 第 一 位 是 最 左 侧 一 位 加 法 需 的 进位 输出 ， 而 接 下 
来 的 位 就 是 从 左 往 右 各 加 法 需 的 和 值 位 。 

如 图 1-8 所 示 的 电路 是 由 位 数据 模型 以 及 门 的 原始 运算 形成 的 算法 。 不 过 这 不 是 一 种 特别 好 
的 算法 ， 因 为 要 是 不 计算 完 最 右 侧 那 一 位 ， 就 不 能 计算 zi 或 右 起 第 二 位 的 进位 输出 。 不 计算 完 
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右 起 第 二 位 ， 就 不 能 计算 zs 或 右 起 第 三 位 的 进位 输出 ， 诸 如 此 类 。 因 此 ,该 电路 花费 的 时 间 就 
是 加 数 的 位 长 ( 在 本 例 中 是 32 ) 乘 上 每 个 一 位 加 法 需 执 行 运算 所 需 的 时 间 。 


20 


Xl Xo 
al 30 Jo 
d 一 一 一 + -一 一 0 
231 230 


20 


图 1-8 行 波 进 位 加 法 器 : qdz31z30…20=xX31X30'…*X0ty31y30…y0 





有 人 可 能 会 认为 ， 进 位 在 每 个 一 位 加 法 需 间 “行进 ”的 需求 ， 是 加 法 定义 中 国有 的 。 要 是 
这 些 读 者 知道 计算 机 还 有 快 得 多 的 加 法 计算 方式 ， 肯 是 会 大 吃 一 尺 的 。 我 们 将 在 第 13 章 讨论 电 
路 的 设计 时 ， 介 绍 一 种 改进 过 的 加 法 算法 。 





1.3.4 习题 


(1) 解释 数据 模型 静态 方面 和 动态 方面 的 差异 。 

CO) 描述 自己 最 喜欢 的 视频 游戏 的 数据 模型 。 区 分 其 模型 的 静态 方面 和 动态 方面 。 提 示 : 静态 部 分 不 
仅 是 指 计 分 牌 上 不 会 移动 的 部 分 。 例 如 ， 在 《 吃 豆 人 》 游 戏 里 ， 欧 态 部 分 不 仅 包括 地 图 ， 还 包括 
“强化 药丸 ”和 “怪物 ”等 。 

G) 描述 自己 最 喜欢 的 文本 编辑 器 的 数据 模型 。 

(4) 描述 电子 表格 程序 的 数据 模型 。 














1.4 C 语言 数据 模型 


在 本 市 中 ,我 们 将 重点 介绍 C 语 言 所 使 用 数据 模型 的 重要 部 分 。 以 图 1-9 所 示 的 C 语 言 程序 
为 例 ， 该 程序 使 用 变量 num 来 计算 其 输入 中 所 含 的 字符 数 。 


#include <stdio.h> 
main() 


{ 


int num; 

num = 0; 

while (getchar() != EOF) 
++num; /* add 1 to num */ 

printf("%d\n", num); 





图 1-9 计算 输出 所 含 字符 数 的 C 语 言 程 序 


程序 的 第 一 行 告 诉 C 语 言 预 处 理 器 ， 将 标准 输入 /输出 文件 stdio.h 包 含 为 源 的 一 部 分 。 该 
文件 含有 getchar 及 printf 了 负数 的 定义 ， 以 及 表示 文件 结束 的 符号 常量 EOF。 
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C 语 言 程序 本 映 也 包含 一 系列 的 定义 ， 既 可 以 是 函数 的 定义 ， 也 可 以 是 数据 的 定义 ， 其 中 
必须 要 有 main 气 数 的 定义 。 图 1-9 所 示 程 序 的 函数 体 中 ,第 一 条 语句 声明 了 int 类 型 的 变量 num 
(在 C 语 言 程 序 中 ， 所 有 变量 在 使 用 前 都 必须 先 声 明 )， 下 一 条 语句 将 num 初 始 化 为 0， 接 下 来 的 
while 语 句 则 使 用 库 函 数 getchaz 一 次 读 和 一 个 输入 字符 ,并 在 每 次 字符 读 人 后 递增 num 变 量 ， 
直到 没有 输入 字符 可 供 读 入 为 止 。 输入 中 的 特殊 值 EOF 会 提示 文件 已 达 末 尾 。printf 语 句 则 会 
将 num 的 值 以 十 进 制 整数 之 后 加 上 换行 符 的 形式 打印 出 来 。 


1.4.1 C 语 言 类 型 系统 


首先 介绍 C 语 言 数据 模型 的 静态 部 分 一 一 类 型 系统 ， 它 描述 了 数据 可 能 拥有 的 值 。 随 后 要 
讨论 C 语 言 数 据 模型 的 动态 部 分 ， 也 就 是 可 以 对 数据 进行 的 操作 。 

在 C 语 言 中 ， 有 着 类 型 构成 的 无 限 集合 ， 其 中 的 任意 元 素 都 可 以 成 为 与 某 个 特定 变量 相关 
联 的 类 型 。 这 些 类 型 以 及 构成 类 型 的 规则 就 形成 了 C 语 言 的 类 型 系统 。 类 型 系统 包含 整数 这 样 
的 基本 类 型 以 及 一 些 类 型 构成 规则 (type-formation rule )， 利 用 这 些 规则 ， 我 们 可 以 用 已 知 的 类 
型 逐步 构建 更 为 复杂 的 类 型 。C 语 言 的 基本 类 型 包括 : 

(1) 字符 (char、signed char、unsigned char ); 




















(2) 整数 (int、short int、long int、unsigned ); 

(3) 浮 点 数 (float、double、long double ); 

(4) 枚 举 ( enum )。 

整数 和 浮 点 数 称 为 算术 类 型 。 

类 型 构成 规则 假设 我 们 已 经 有 了 一 些 类 型 ， 可 以 是 基本 类 型 或 使 用 这 些 规则 构建 好 的 其 他 
类 型 。 以 下 是 C 语 言 中 的 一 些 类 型 构成 规则 。 

(1) 数 组 类 型 。 可 以 用 以 下 声明 构建 一 个 元 素 类 型 为 7 的 数组 : 

TAI[n] 

该 语句 声明 了 包含 个 元 素 的 数组 A， 其 中 每 个 元 素 都 是 7 类 型 的 。 在 C 语 言 中 ,数组 下 标 是 
从 0 开始 的 ， 所 以 数组 的 第 一 个 元 素 是 A[0] ， 而 最 后 一 个 元 素 是 A[n-1] 。 数 组 可 由 字符 、 算 术 
类 型 、 指 针 、 结 构 体 、 共 用 体 或 其 他 数组 构成 。 

(2) 结构 体 类 型 。 在 C 语 言 中 , 结构 体 是 由 称 为 成 员 或 字段 的 变量 构成 的 分 组 。 在 结构 体 中 ， 
不 同 的 成 员 可 以 具有 不 同 的 类 型 ， 但 每 个 成 员 都 必须 具有 某 一 个 类 型 的 元 素 。 如 果 九 、 刀 、… 
7 是 类 型 ， 而 M1、M，、…、MM 是 成 员 名 称 ， 那 么 如 下 声明 

struct S { 


TT Mi; 
72 MM; 

















n Ma; 

} 

就 定义 了 标记 ( 即 其 类 型 的 名 称 ) 为 而 且 具 有 nn 个 成 员 的 结构 体 。 对 i= 1、2、…、n 来 说 ， 
第 i 个 成 员 名 称 为 M;:， 且 其 值 为 7 类 型 。 示 例 1.1 就 展示 了 一 个 结构 体 。 该 结构 体 的 标记 是 CELL， 
并 含有 两 个 成 员 。 第 一 个 成 员 的 名 称 是 element， 类 型 为 整数 。 第 二 个 成 员 名 称 为 next, 它 的 
类 型 是 指向 某 个 同类 型 结构 体 的 指针 。 

结构 体 标记 5S 是 可 选 的 ， 不 过 它 可 以 在 随后 的 声明 中 为 表示 类 型 提供 方便 的 人 简写。 例如 ， 
声明 
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struct SS myRecord; 

定义 了 变量 myRecord 是 一 个 类 型 为 的 结构 体 。 

(3) 共用 体 类 型 。 共 用 体 类 型 允许 一 个 变量 在 程序 执行 的 不 同时 期 具有 不 同 的 类 型 。 
声明 

uniont{ 


TT Mi; 
72 MM; 





T, Mi; 
} 33 


定义 了 变量 x， 可 以 存放 类 型 为 71、7T、…、 卫 中 任意 一 种 的 值 。 成 员 名 称 M1、M2、…… 
MM 用 来 指示 x 的 值 现 在 应 该 是 哪 种 类 型 。 也 就 是 说 ，x.M 就 表明 x 的 值 是 类 型 为 的 值 。 

(4) 指针 类 型 。C 语 言 的 独特 之 处 在 于 对 指针 的 依赖 。 指 针 类 型 的 变量 包含 某 个 存储 区 域 的 
地 址 。 可 以 通过 指针 ， 间 接地 访问 另 一 个 变量 。 声 明 

T*p; 

定义 了 变量 p 是 指向 某 个 7 类 型 变量 的 指针 。 用 p 来 表示 指向 7 的 类 型 指针 的 框 ， 框 p 的 值 就 
是 个 指针 。 我 们 往往 将 p 的 值 表 示 成 一 个 箭头 ， 而 不 是 将 其 表示 成 7 类 型 的 对 象 本 身 ， 如 图 1-10 
所 示 。 真 正 出 现在 p 框 中 的 是 7 类 型 对 象 在 计算 机 中 存储 的 地 址 (或 位 置 )。 





7 类 型 
了 的 对 象 


图 1-10 变量 p 是 指向 7 的 类 型 指针 
考虑 如 下 声明 
int x, *p; 
在 C 语 言 中 ， 一 元 运算 符 g 是 用 来 获取 对 象 地 址 的 ， 所 以 声明 
P = &x; 
将 x 的 地 址 赋值 给 be， 也 就 是 说 ， 这 让 p 指 问 x。 
用 在 p 前 面 的 一 元 运算 符 * 会 获取 p 指 癌 的 框 的 值 ， 所 以 声明 








y = *p; 
会 将 框 p 指 向 的 内 容 赋值 给 y。 如 果 y 是 int 类 型 的 变量 ， 那 么 


&xX; 
* 


Fy 


+ 示例 1.4 
C 语 言 的 typedef 结 构 可 用 来 创建 类 型 名 称 的 同 义 字 。 
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看 一 看 图 1-11 中 的 4 个 typedef 声 明 。 依照 对 C 语 言 中 数据 的 传统 看 法 ， 类 型 typel 是 有 10 
个 槽 ( slot ) 的 数组 ， 每 个 槽 中 都 存放 着 一 个 整数 ， 如 图 1-12a 所 示 。 同 样 ， 类 型 type2 的 对 象 
是 指向 这 类 数组 的 指针 ， 如 图 1-12b 所 示 。 而 类 型 type3 的 结构 体 则 被 表现 为 图 1-12c 中 所 示 的 
形式 ,每 个 字段 都 有 一 个 槽 与 其 对 应 。 请 注意 , 字段 名 称 ( 例如 field1 ) 实际 上 并 未 与 字段 的 
值 一 起 出 现 。 最 后 ， 数 组 类 型 type4 的 对 象 将 会 有 5$ 个 槽 ， 每 个 槽 都 存放 着 类 型 type3 的 对 象 ， 
即 如 图 1-12d 所 示 的 结构 体 。 








typedef int Distance ; 
typedef int typel[10] ; 


typedef typel *type2; 
typedef struct { 

int fieldl ; 

type2 field2; 
} type3; 








typedef type3 type4[5]; 


图 1-11 一 些 C 语 言 typedef 声 明 





(a) 





(d) 
图 1-12 图 1-11 中 类 型 声明 的 形象 化 表示 
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类 型 、 名 字 、 变 量 和 标识 符 


与 数据 对 象 相关 的 一 些 术 语 有 不 同 的 含义 却 又 容易 混淆 ,首先 ,类 型 描述 了 数据 对 象 的 “ 形 
状 ”。 在 C 语 言 中 ， 可 以 使 用 typedef 结 构 为 已 有 的 类 型 定义 一 个 新 名 字 7， 

typedef < 类 型 描述 符 >T 

这 里 的 类 型 描述 符 是 个 表达 式 ， 告 诉 我 们 7 类 型 的 对 象 是 什么 样子 。 

类 型 为 7 的 typedef 声 明 实 际 上 并 没有 创建 7 类 型 的 对 象 。 要 创建 7 类 型 的 对 象 ， 需要 使 用 
如 下 形式 的 声明 

Tx; 

这 里 的 x 是 个 标识 符 , 或 者 说 是 “变量 名 "。x 有 可 能 是 静态 的 (不 是 任何 函数 的 局 部 变量 )， 
在 这 种 情况 下 , 表示 x 的 框 在 程序 开始 时 就 创建 了 。 如 果 x 不 是 静态 的 ,那么 它 应 该 是 菜 个 函数 
的 局 部 交 量 。 在 调用 FF 时 ， 就 会 创建 一 个 名 为 “与 本 次 对 FF 的 调用 相关 联 的 x” 的 框 。 更 准确 
地 说 ,该 框 的 名 称 还 是 x， 不 过 只 在 执行 本 次 对 FF 的 调用 时 ， 才 使 用 标识 符 x 来 表示 该 框 。 

正如 文中 提 到 的 ,因为 F 可 能 是 递归 函数 ,所 以 可 能 存在 许多 名 称 涉 及 标识 符 x 的 框 。 甚 至 
可 能 会 有 其 他 函数 使 用 标识 符 x 命 名 自己 的 某 个 变量 。 此 外 ， 名 字 比 标识 符 更 具 一 般 性 ， 因 为 
有 很 多 种 表达 式 可 以 用 来 为 框 命名 。 例 如 , 我 们 提 到 过 *p 可 以 是 指针 pb 指向 的 某 个 对 象 的 名 字 ， 
而 该 对 象 的 其 他 名 字 也 可 以 是 复杂 的 表达 式 ， 比 如 (*p) .f[21 或 p->f[2]。 这 两 个 复杂 表达 
式 是 等 价 的 ， 都 表示 指针 p 指 向 的 结构 体 中 f 字 段 数组 的 第 二 个 元 素 。 





1.4.2 ”基数 


函数 也 具有 与 之 关联 的 类 型 ， 即 使 我 们 没有 像 处 理 程序 变量 那样 ， 将 框 或 “ 值 ” 与 函数 相 
关联 。 对 任意 的 一 列 类 型 、T5、…、7,， 我 们 可 以 定义 一 个 函数 ， 具 有 nn 个 类 型 依次 为 这 些 类 
型 的 参数 。 这 一 列 类 型 后 面 带 上 函数 返回 的 值 ( 返回 值 ) 的 类 型 ， 就 是 这 个 图 数 的 “类 型 ”。 如 
果 函 数 没有 返回 值 ， 那 么 该 函数 就 是 void 类 型 的 。 

一 般 情况 下 ， 可 以 应 用 类 型 构成 规则 任意 地 构建 类 型 ， 不 过 也 存在 一 些 限制 。 比 如 ， 不 能 
构建 “函数 数组 ”， 不 过 构建 由 指向 函数 的 指针 构成 的 数组 是 可 以 的 。 在 C 语 言 中 构建 类 型 的 完 
整 规则 可 以 在 ANSI 标 准 中 找到 。 


1.4.3”C 语 言 数 据 模 型 中 的 操作 
C 语 言 数据 模型 中 的 数据 操作 可 分 为 以 下 三 类 。 
(D 创建 或 销毁 数据 对 象 的 操作 。 
(2) 访问 或 修改 数据 对 象 某 些 部 分 的 操作 。 
(3) 将 若干 数据 对 象 的 值 组 合 起 来 ， 为 某 个 数据 对 象 生成 新 值 的 操作 。 
1.4.4 数据 对 象 的 创建 和 销毁 
对 于 数据 的 创建 ，C 语 言 提供 了 几 种 简陋 的 机 制 。 在 函数 被 调用 时 ， 会 创建 对 应 每 个 局 部 


参数 的 框 ， 这 些 框 都 用 来 存放 参数 的 值 。 
另 一 种 数据 创建 机 制 是 使 用 程序 库 例 程 malloc (n) ， 该 例 程 可 以 返回 一 个 指针 ， 指 向 n 个 
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未 使 用 的 连续 字符 位 置 , 这 些 存储 空间 可 被 nalloc 的 调用 者 用 来 存储 数据 。 然后 就 可 以 在 这 一 
存储 区 域 中 创建 数据 对 象 。 

C 语 言 有 着 类 似 的 方法 来 销毁 数据 对 象 。 当 函数 返回 时 ， 该 函数 调用 的 局 部 参数 将 不 复 存 
在 。 例 程 Eree 会 释放 malloc 创 建 的 存储 空间 。 特 别 要 说 的 是 ， 调 用 free (p) 的 效果 是 释放 p 
指向 的 存储 区 域 。 奉 使 用 free 去 销 虹 不 是 通过 调用 mal1loc 创 建 的 对 象 ， 会 造成 灾难 性 后 果 。 


1.4.5 ”数据 的 访问 和 修改 


C 语 言 具 有 访问 对 象 某 些 部 分 的 机 制 。 可 以 使 用 a [i] 访 问 数组 a 的 第 i 个 元 素 ， 用 x.m 访 问 
结构 x 的 成 员 m， 还 可 以 用 *p 访 问 指 针 p 指 回 的 对 象 。 

在 C 语 言 中 ， 修 改 (或 者 说 是 写 ) 值 主要 是 由 赋值 运算 符 完成 的 ， 这 让 我 们 可 以 改变 对 象 
的 值 。 


+ 示例 1.5 
如 果 变 量 a 的 类 型 是 示例 1.4 中 所 定义 的 type4， 那 么 
(*a[0] .field2) [3] = 99; 


就 把 值 99 赋 给 了 数组 a 第 一 个 元 素 所 代表 的 结构 体 中 fielq2 指 向 的 数组 的 第 4 个 元 素 。 
1.4.6 ”数据 的 组 合 


C 语 言 有 着 丰富 的 运算 符 ， 可 用 来 对 值 进 行 操作 和 组 合 。 主 要 运算 符 包括 如 下 这 些 。 
(1) 算术 运算 符 。C 语 言 提 供 了 以 下 几 种 算术 运算 符 。 
(a) 用 于 整数 和 浮 点 数 的 常规 二 元 算术 运算 符 +、-、*、/。 整 数 除法 会 取 整 〈《4/3 得 1 )。 
(b) 一 元 的 + 和 -运算 符 。 
(c) 取 模 运 算 符 i%j 的 结果 是 i 除 以 7 的 余数 。 
(qd) 递增 和 递减 运算 符 ++ 和 --， 适 用 于 单个 整数 变量 反复 从 自身 增加 或 减 去 1。 这 些 运算 
符 可 以 出 现在 它们 的 操作 数 之 前 ， 也 可 以 出 现在 它们 的 操作 数 之 后 ， 取 决 于 我 们 是 
想 在 改变 变量 的 值 之 前 还 是 之 后 计算 该 表达 式 的 值 。 
(2) 逻辑 运算 符 。C 语 言 中 没有 布尔 类 型 ， 它 使 用 “0” 来 表示 逻辑 值 “ 假 "， 使 用 “ 非 0” 表 
示 逻 辑 值 “ 真 "。"C 语 言 使 用 以 下 几 种 逻辑 运算 符 。 
(a) && 表 示 AND 运 算 。 例如， 表达 式 x&&y 在 两 个 操作 数 都 非 0 的 情况 下 会 返回 1， 否 则 返 
回 0。 不 过 ， 如 果 x 的 值 为 0， 就 不 考虑 y 的 值 了 。 
(b) | | 表示 oR 运算 。 表 达 式 x | |y 在 x 或 y 非 0 的 情况 下 会 返回 1， 否 则 返回 9。 不过， 如 果 
x 的 值 非 0， 就 不 考虑 y 的 值 了 。 
(9) 一 元 的 和 否定 运算 符 !x 在 x 非 0 时 返回 0， 在 xz=0 时 返回 1。 
(d) 条 件 运 算 符 是 三 元 (三 参数 ) 运算 符 ， 用 一 个 问号 和 一 个 冒号 表示 。 表 达 式 x?y:z 
在 x 为 真 ( 即 xz 为 非 0 ) 的 情况 下 会 返回 y 的 值 ， 在 x 为 假 ( 即 x=0 ) 的 情况 下 会 返回 z 
的 值 。 
(3) 比较 运算 符 。 对 整数 或 浮 点 数 使 用 6 种 关系 比较 运算 符 之 一 (一 、! =、<、>、<=、 和 
>= )， 如 果 关 系 不 成 立 ， 结 果 就 为 0， 否 则 结果 为 1。 












































Qa 我 们 将 反复 使 用 TRUE 和 FALSE 作 为 已 定义 的 常量 1 和 0， 来 表示 布尔 值 ， 详 见 1.6 节 。 
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(4) 位 运算 运算 符 。C 语 言 提供 了 一 些 实用 的 位 逻辑 运算 符 ， 将 整数 当 作 与 它们 的 二 进 制 形 
式 相同 的 位 字符 串 。 这 些 运 算 符 包括 ， 用 于 按 位 与 的 ge， 用 于 按 位 或 的 | ， 用 于 按 位 异 
或 的 ~， 用 于 左 移 位 的 <<， 用 于 右 移 位 的 >>， 以 及 用 于 左 移 位 的 波浪 字符 ( ~ )。 

(5) 赋值 运算 符 。C 语 言 使 用 = 作为 赋值 运算 符 。 除 此 之 外 ， 还 允许 将 x=x+y; 这 样 的 表达 
式 写 为 x += y; 这 样 的 简短 形式 。 类 似 的 格式 也 可 以 用 于 其 他 二 元 算术 运算 符 。 

(6) 强制 转换 运算 符 。 强 制 转换 是 指 将 某 个 类 型 的 值 转换 成 另 一 个 类 型 的 等 价值 的 过 程 。 
例如 ， 如 果 x 是 浮 点 数 ， 而 i 是 整数 ， 那 么 x= i 会 导致 1 的 整数 值 被 转换 成 值 相等 的 浮 点 
数 。 在 这 里 ， 强 制 转换 运算 符 并 未 显 式 出 现 ， 不 过 C 语 言 编译 器 会 推断 从 整数 到 浮 点 数 
的 转换 是 必要 的 ， 并 自动 执行 所 需 的 转换 步骤 。 

1.4.7 “习题 
(1) 解释 C 语 言 程序 的 标识 符 与 名 字 ( 用 于 “ 框 ”或 数据 对 象 ) 之 间 的 区 别 。 


(2) 举例 说 出 有 多 个 名 字 的 C 语 言 数据 对 象 。 
(3) 如 果 熟 悉 C 语 言 之 外 的 编程 语言 ， 描 述 一 下 它 的 类 型 系统 和 操作 。 


1.5 ”算法 和 程序 设计 


对 数据 模型 、 它 们 的 属性 及 其 适当 用 途 的 研究 是 计算 机 科学 的 一 大 核心 ， 而 与 其 同等 重要 
的 一 大 核心 便 是 对 算法 以 及 与 其 相关 的 数据 结构 的 研究 。 我 们 需要 了 解 执行 常见 任务 的 最 佳 方 
法 ， 而 且 和 需要 学 习 设 计 优 秀 算法 的 主要 技术 。 此 外 ， 我 们 还 需要 了 解 如 何 将 数据 结构 和 算法 的 
使 用 融入 创建 实用 程序 的 过 程 中 。 数 据 模型 、 算 法 、 数 据 结 构 ， 以 及 它们 在 程序 中 的 实现 ， 这 
些 主题 相互 依存 ， 而 且 每 个 主题 都 会 在 本 书 中 出 现 多 次 。 在 本 节 中 ， 我 们 将 粗略 地 提 到 一 些 与 
程序 的 设计 和 实现 有 关 的 知识 。 


1.5.1 软件 的 创建 


在 程序 设计 课 上 ， 当 我 们 拿 到 编程 问题 时 ， 可 能 需要 设计 解决 问题 的 算法 、 用 某 种 语言 实 
现 该 算法 、 编 译 程序 并 用 一 些 示 例 数 据 运行 它 ， 然 后 提交 该 程序 给 老师 打分 。 

而 在 商业 背景 中 ， 编 程 环 境 则 完全 不 同 。 算 法 通常 只 不 过 是 完整 程序 的 一 小 部 分 ， 至 少 对 
那些 简单 平常 到 信 手 可 拾 的 算法 来 说 是 这 样 。 而 程序 通常 是 涉及 硬件 和 软件 的 更 大 系统 的 组 件 。 
程序 及 其 所 能 入 的 完整 系统 ， 都 是 由 程序 员 和 工程 师 团 队 开 发 的 ， 这 样 的 团队 可 能 有 数 百 人 的 
规模 。 

软件 系统 的 开发 过 程 通 稍 要 跨越 多 个 阶段 。 虽 然 这些 阶 段 表面 上 可 能 和 解决 课 符 编程 任务 
所 涉及 的 步 又 有 相似 之 处 ， 但 是 构建 软件 系统 来 解决 特定 问题 的 功夫 多 数 并 没有 花 在 编程 上 。 
下 面 要 讲 的 是 一 种 理想 化 的 场景 。 

问题 的 定义 和 需求 说 明 。 在 创建 软件 系统 的 过 程 中 ， 最 难 也 是 最 重要 的 部 分 是 定义 真正 的 
问题 所 在 并 指明 解决 问题 所 需 的 条 件 。 通 常 ， 问 题 的 定义 始 于 对 用 户 需 求 的 分 析 ， 不 过 这 些 需 
求 通常 是 不 准确 的 ， 而 且 很 难 写 下 来 。 系 统 架 构 师 可 能 要 咨询 系统 未 来 的 用 户 ， 并 对 需求 说 明 
进行 迭代 ， 直 到 详解 者 ( specifier， 拟 定 需 求 说 明 的 人 ) 和 用 户 都 对 定义 和 解决 手头 问题 的 需求 
说 明 感到 满意 为 止 。 在 需求 说 明 阶 段 ， 为 最 终 系统 建立 简单 的 原型 或 模型 是 有 好 人 处 的 ， 因 为 这 
样 可 以 深入 了 解 系统 的 行为 和 可 能 的 用 途 。 数 据 建 模 也 是 问题 定义 阶段 的 一 个 重要 工具 。 
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设计 。 一 旦 完成 需求 说 明 ， 系 统 的 上 层 设 计 就 已 成 形 ， 而 且 主 要 组 成 部 分 也 确定 了 。 开 发 
人 员 会 拟定 一 份 概述 上 层 设 计 已 完成 的 文档 ， 文 档 中 还 可 能 包含 系统 的 性 能 要 求 。 该 阶段 还 可 
能 引入 有 关 茶 些 主要 组 件 的 更 详细 的 需求 说 明 。 高 性 价 比 的 设计 往往 需要 重用 或 修改 以 前 构造 
的 组 件 ， 诸 如 面向 对 象 技 术 这 样 的 多 种 软件 方法 论 推动 了 组 件 的 重用 。 

实现 。 一 旦 敲定 设计 ， 就 可 以 开始 实现 组 件 了 。 本 书 中 讨论 的 很 多 算法 都 能 在 实现 新 组 件 
的 过 程 中 派 上 有 用场。 一旦 完成 组 件 的 实现 工作 ， 就 要 对 其 进行 一 系列 的 测试 ， 以 确保 它 能 像 需 
求 说 明 所 说 的 那样 工作 。 

集成 和 系统 测试 。 当 组 件 得 到 实现 而 且 已 经 单独 测试 过 ， 就 应 该 将 整个 系统 组 合 起 来 并 进 
行 测试 。 

安装 和 现场 测试 。 一旦 开发 人 员 觉 得 系统 已 经 能 以 令 客户 满意 的 状态 运转 ， 就 可 以 将 系统 
安装 到 客户 的 办 公 地 点 ， 并 进行 最 终 的 现场 测试 。 

维护 。 至 此 ， 我 们 可 能 会 认为 已 经 完成 了 大 部 分 的 工作 。 然 而 ， 还 需要 有 维护 工作 。 在 很 
多 情况 下 , 维护 可 能 要 占据 超过 一 半 的 系统 开发 成 本 。 维护 可 能 涉及 修改 组 件 来 消除 不 可 预见 的 
副作用 、 修 正 或 提高 系统 性 能 , 或 增加 新 功能 等 目的 。 因 为 维护 是 软件 系统 设计 中 很 重要 的 部 分 ， 
所 以 编写 的 程序 务 要 正确 、 耐 用 、 高 效 、 可 修改 ， 并 且 能 从 一 台 计 算 机 移植 到 另 一 人 台 计 算 机 。 

尽早 地 发 现 错误 很 重要 ， 最 好 是 在 问题 定义 阶段 就 能 发 现 错误 。 越 到 后 面 的 阶段 ， 修 复 设 
计 错 误 或 编程 错误 的 成 本 越 高 ， 对 需求 和 设计 的 独立 审查 有 利于 减少 后 续 的 错误 。 


1.5.2 ”编程 风格 


编写 他 人 能 够 轻松 阅读 和 修改 的 程序 ， 便 能 够 显著 减轻 维护 负担 。 好 的 编程 风格 都 是 练习 
的 结果 ， 建 议 大 家 一 开始 就 试 着 编写 方便 他 人 理解 的 程序 。 没 有 什么 神奇 公式 能 确保 程序 的 可 
读 性 ， 不 过 还 是 有 一 些 实用 经 验 可 介绍 给 大 家 。 

(1) 将 程序 分 成 相关 的 模块 。 

(2) 为 程序 排版 ， 使 其 结构 清晰 。 

(3) 编写 易于 理解 的 注释 来 解释 程序 。 清 晰 准确 地 描述 底层 数据 模型 、 用 来 表示 数据 模型 的 
数据 结构 和 每 个 例 程 所 执行 的 操作 。 在 描述 例 程 时 ， 要 陈述 对 其 输入 作出 的 假设 ， 并 讲 清 输 出 
和 输入 有 什么 关系 。 

(4) 对 例 程 和 变量 使 用 有 意义 的 名 称 。 

(5) 尽 可 能 避免 使 用 明确 的 常数 。 例 如 ， 不 要 用 数字 7 表示 小 矮人 的 个 数 ， 而 是 要 使 用 诸如 
NumberOfDwarfs 这 样 定义 的 背 量 ,这 样 一 来 ， 如 果 决 定 再 加 上 一 个 小 矮人 ， 就 可 以 很 方便 地 
将 该 常量 的 值 改 为 8。 

(6) 避免 使 用 “全 局 变量 ”， 即 不 要 为 整个 程序 定义 变量 ， 除 非 程 序 中 的 大 多 数 例 程 都 要 使 
用 该 变量 所 表示 的 数据 。 

另 一 个 编程 好 习惯 就 是 拥有 成 套 测 试 输入 ， 可 以 在 编程 时 对 每 行 代码 进行 测试 。 每 当 为 程 
序 增加 了 新 功能 ， 就 可 以 运行 这 套 测 试 ， 以 确保 新 程序 在 处 理 这 些 起 作用 的 输入 时 能 和 老 程序 
行动 一 致 。 


1.6 ”本 书 中 用 到 的 一 些 C 语言 约定 


在 说 明 与 C 语 言 程序 相关 的 概念 时 ， 有 一 些 实用 的 定义 和 约定 。 其 中 一 些 是 在 标准 头 文件 
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stdio.h 中 也 能 找到 的 常规 约定 ,而 男 一 些 则 是 为 本 书 特别 定义 的 , 必须 在 使 用 它们 的 C 语 言 程 
序 中 包含 这 些 约定 。 

(1) 标识 符 NULL 是 指针 的 值 ， 可 能 在 任何 出 现 指 针 的 地 方 出 现 ， 但 它 是 个 不 能 指向 任何 内 
容 的 值 。 因 此 ， 出 现在 示例 1.1 链 表 节 点 的 next 字 段 中 的 NULL， 可 以 用 来 表示 链表 的 结尾 。 我 
们 还 将 看 到 NUIiL 在 其 他 的 数据 结构 中 也 有 着 诸多 类 似 的 用 途 。NULL 在 stdio.h 头 文件 中 得 到 
了 恰当 的 定义 。 

(2) 标识 符 TRUE 和 FALSE 按 如 下 方式 定义 


#define TRUE 1 
#define FALSE 0 


因此 , 在 任何 需要 逻辑 值 “ 真 ”的 情况 中 都 可 以 使 用 TRUE ， 而 在 逻辑 值 为 “ 假 ” 的 情况 中 
都 可 以 使 用 FALSE。 

(3) 类 型 BOOLEAN 被 定义 为 

typedef int BOOLEAN; 

在 强调 要 表示 的 是 表达 式 的 逻辑 值 而 非 数 值 时 ， 就 会 使 用 BOOLEAN。 

(4) 标识 符 EOF 是 getchar () 这 样 的 文件 读 操 作 函 数 在 无 法 继续 从 文件 读 出 字 节 时 返回 的 
值 。stdaio.h 文 件 为 BoF 定 义 了 一 个 合适 的 值 。 

(5) 我 们 还 要 定义 一 个 宏 , 用 来 生成 示例 1.1 中 所 用 节点 的 声明 。 图 1-13 就 展示 了 一 种 可 取 的 
定义 。 它 声明 单元 具有 两 个 字段 : element 字 段 的 类 型 是 由 参数 Type 给 定 的 ， 而 next 字 段 则 
指 回 具有 本 结构 的 单元 。 该 宏 提 供 了 两 项 外 部 定义 : CellName 是 该 类 型 结构 体 的 名 字 ， 而 
ListName 则 是 指 癌 这 些 单元 的 指针 的 类 型 名 称 。 








#define DefCell(EltType, CellType, ListType) 
typedef struct CellType *ListType; 
struct CellType { 

Eltlype element; 

ListType Dext ; 


ao mi mm 











图 1-13 ”用 来 定义 表 中 单元 的 宏 


+ 示例 1.6 
通过 使 用 宏 
DefCell(int, CELL, LIST); 
可 以 定义 示例 1.1 中 那 种 类 型 的 单元 。 
该 宏 随 后 会 扩展 为 
typedef struct CELL *LIST; 
struct CELL 攻 
int element ; 


LIST next,; 
} 


这 样 一 来 ， 我 们 就 可 以 使 用 cELL 作 为 整数 单元 的 类 型 ， 并 使 用 LIST 作 为 指向 这 些 单元 的 
指针 的 类 型 。 例 如 


CELL c; 
LIST L; 
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定义 了 单元 c， 以 及 指向 单元 的 指针 LL。 请 注意 ,通常 会 用 指向 表 第 一 个 单元 的 指针 来 表示 
一 列 单元 ， 如 果 表 为 空 ， 则 用 NULL 来 表示 。 


1.7 小结 


至 此 ， 大 家 应 该 已 经 从 本 章 中 了 解 到 以 下 概念 。 

口 数据 模型 、 数 据 结构 和 算法 是 怎样 用 来 解决 问题 的 。 

口 数据 模型 “ 表 ” 和 数据 结构 “链表 ”之 间 的 差别 。 

口 无 论 是 编程 语言 、 操 作 系 统 ， 还 是 应 用 程序 ， 每 种 软件 系统 中 都 存在 着 某 种 类 型 的 数据 
模型 。 

DC 语言 所 文 持 数据 模型 的 关键 要 素 。 

口 大 型 软件 系统 开发 过 程 的 主要 步骤 。 
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计算 机 的 威力 源 自 其 反复 执行 同一 任务 或 同一 任务 不 同 版 本 的 能 力 。 在 计算 领域 ， 和 迭代 这 
一 主题 会 以 多 种 形式 出 现 。 数 据 模型 中 的 很 多 概念 〈 比如 表 ) 都 是 某 种 形式 的 重复 ， 比 如 “ 表 
要 么 为 空 , 要 么 由 一 个 元 素 接 一 个 元 素 ， 再 接 一 个 元 素 ， 如 此 往复 而 成 ”。 使 用 和 迭 代 ， 程序 和 算 
法 可 以 在 不 需要 单独 指定 大 量 相似 步 又 的 情况 下 ， 执 行 重复 性 的 任务 ， 如 “执行 下 一 步骤 1000 
次 ”。 编 程 语言 使 用 像 C 语 言 中 的 while 语 句 和 for 语 句 那 样 的 循环 结构 ， 来 实现 迭代 算法 。 

与 重复 密切 相关 的 是 递归 ， 在 递归 技术 中 ， 概 念 是 直接 或 间接 由 其 自身 定义 的 。 例 如 ,我 
们 可 以 通过 “ 表 要 么 为 空 ， 要 么 是 一 个 元 素 后 面 再 跟 上 一 个 表 ” 这 样 的 描述 来 定义 表 。 很 多 编 
程 语 言 都 支持 递归 。 在 C 语 言 中 ， 也 数 F 是 可 以 调用 自 喘 的 ， 既 可 以 从 F 的 函数 体 中 直接 调用 自 
己 ， 也 可 以 通过 一 连 串 的 吨 数 调用 ， 最 终 间接 调用 F。 另 一 个 重要 思想 一 一 归纳 ， 是 与 “递归 ” 
密切 相关 的 ， 而 且 和 常用 于 数学 证 明 中 。 

迭代 、 归 纳 和 递归 都 是 基本 概念 ， 会 以 多 种 形式 出 现在 数据 模型 、 数 据 结构 和 算法 中 。 下 
面 介绍 了 一 些 使 用 这 些 概念 的 例子 ， 每 项 内 容 都 会 在 本 书 中 详细 介绍 。 

(1) 和 迭代 技术 。 反 复 执行 一 系列 操作 的 最 简单 方法 就 是 使 用 友 代 结构 , 比如 C 语 言 中 的 for 语 句 。 

(2) 递归 程序 设计 。C 语 言及 其 他 众多 语言 都 允许 函数 递归 ， 即 函数 可 以 直接 或 间接 地 调用 
自己 。 对 新 手 程序 员 来 说， 编写 迭代 程序 通常 比 写 递 归程 序 更 安全 ， 不 过 本 书 的 一 个 重要 目标 
就 是 让 读者 习惯 在 适当 的 时 候 用 递归 的 方式 来 思考 和 编程 。 递 归程 序 更 易于 编写 、 分 析 和 理解 。 






































符号 ， 求 和 符号 和 求 积 符号 

a 
这 1 个 整数 的 和 ， 也 就 是 1+2+3+ '…… +n。 更 加 一 般 化 的 情况 是 ， 我 们 可 以 对 任何 具有 求 和 指标 
(summation index ) 的 函数 / () 求 和 。( 当然 ， 这 个 指标 也 可 能 是 1 以 外 的 一 些 符号 。) 表达 式 
D',f() 就 表示 

fl)+f(atD+f(at+2)+.+ f (2) 

例如 ， 了 ”六 就 表示 4+9+16+…+1m? 的 和 ， 这 里 的 函数 /就 是 “ 求 平方 "， 而 我 们 用 
了 指标 /来 代替 六 

作为 特例 ， 如 果 b<a， 那 么 表达 式 > ， ,GD) 不 含 任何 项 ， 当 然 ， 其 值 也 就 是 0 了 。 如 果 六 = 
4a， 那 么 表达 式 只 有 i= 4 时 的 那 一 项 。 因 此 ，》 ” JG) 的 值 就 是 / (4)。 
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用 于 求 积 的 类 似 符号 是 个 大 号 的 大 写 希腊 字母 II 。 表 达 式 ”GD) 就 表示 
Ja)x ya+Dxae+2)x…x 大 (D) 
的 积 ， 如 果 b<a， 那 么 该 表达 式 的 值 为 1。 





(3) 归纳 证 明 。“ 归 纳 证 明 ” 是 用 来 表明 命题 为 真 的 一 项 重要 技术 。 从 2.3 节 开始 ， 我 们 将 广 
泛 介 绍 归 纳 证 明 。 下 面 是 归纳 证 明 最 简单 的 一 种 形式 。 我 们 有 与 变量 xz 相关 的 命题 %)， 和 希望 证 
明 S(n) 为 真 。 要 证 明 S(n)， 首先 要 提供 依据 ， 也 就 是 n 为 某 个 值 时 的 命题 S(n)。 例 如， 我 们 可 以 令 
n = 0， 并 证 明 命题 %\0)。 接 着 ， 我 们 必须 对 归纳 步骤 加 以 证 明 ， 我 们 要 证 明 ， 对 应 参数 某 个 值 
的 命题 $， 是 由 对 应 参数 前 一 个 值 的 相同 命题 $ 得 出 的 ， 也 就 是 说 ， 对 所 有 的 n 二 0， 可 从 S(n) 得 
到 S(n+1)。 例 如 ，S(n) 可 能 是 常见 的 求 和 公式 

Vi= n(n+l)/2 (2.1) 

这 是 说 1 到 n 这 n 个 整数 的 和 等 于 n(n+1)/2。 特 例 可 以 是 S(1)， 即 等 式 (2.1) 在 n 为 1 时 的 情况 ， 
也 就 是 1=1 x 2/2。 归 纳 步 又 就 是 要 表明 , 由 > ”n(n+1)/2 可 以 得 出 DY n+ Dn+2)/2, 前 者 
就 是 S(n)， 是 等 式 (2.1) 本 身 , 而 后 者 则 是 S(n+1), 就 是 用 n+1 蔡 换 了 等 式 (2.1) 中 的 n。2.3 市 将 会 为 
大 家 展示 如 何 进行 这 样 的 证 明 。 

(4) 程序 正确 性 证 明 。 在 计算 机 科学 中 ， 我 们 常 希 望 能 够 证 明 与 程序 有 关 的 命题 $(n) 为 真 ， 
不 管 是 采用 正式 的 还 是 非 正式 的 方式 。 例 如 ,命题 S(n) 可 能 描述 了 某 个 循环 的 第 n 次 迭代 中 什么 
为 真 ,或 是 对 某 个 函数 的 第 n 次 递归 调用 来 说 什么 为 真 , 对 这 类 命题 的 证 明 一 般 都 使 用 归纳 证 明 。 

(5) 归纳 定义 。 计 算 机 科学 的 很 多 重要 概念 ， 特 别 是 那些 涉及 数据 模型 的 ， 最 好 用 归纳 的 
形式 来 定义 ， 也 就 是 我 们 给 出 定义 该 概念 最 简单 形式 的 基本 规则 ， 以 及 可 用 来 从 该 概念 较 小 实 
例 构 建 更 大 实例 的 归纳 规则 。 举 例 来 说 ， 我 们 提 到 过 的 表 就 可 由 基本 规则 ( 空 表 是 表 ) 加 上 归 
纳 规则 ( 一 个 元 素 后 面 跟 上 一 个 表 也 是 表 ) 来 定义 。 

(6) 运行 时 间 的 分 析 。 算 法 处 理 不 同 大 小 的 输入 所 花 的 时 长 (算法 的 “运行 时 间 ”) 是 衡量 
其 “优良 性 ”的 一 项 重要 指标 。 当 算法 涉及 递归 时 ， 我 们 会 使 用 名 为 递 推 方程 的 公式 ， 它 是 种 
归纳 定义 ， 可 以 预测 算法 处 理 不 同 大 小 的 输入 所 花 的 时 间 。 

本 章 会 介绍 前 5 项 主题 ， 程 序 的 运行 时 间 将 在 第 3 章 中 介绍 。 
































2.1 本 章 主要 内 容 


在 本 章 中 ， 我 们 将 介绍 以 下 主要 概念 。 

口 迭代 程序 设计 (2.2 节 )。 

口 归纳 证 明 (2.3 节 和 2.4 节 )。 

口 归纳 定义 ( 2.6 市 )。 

口 递归 程序 设计 (2.7 和 和 2.8 市 )。 

口 证 明 程 序 的 正确 性 ( 2.5 节 和 2.9 节 )。 

除 此 之 外 ， 通 过 这 些 概 念 的 例子 ， 我 们 还 会 着 重 介绍 计算 机 科学 中 一 些 有 趣 的 重要 思想 。 
其 中 包括 : 

口 排序 算法 ， 包 括 选 择 排序 (2.2 节 ) 和 归并 排序 ( 2.8 节 )。 
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口 奇偶 校 验 及 数据 错误 的 检测 ( 2.3 市 )。 
口 算术 表达 式 及 其 代数 变形 〈2.4 节 和 2.6 节 )。 
口 平 衔 圆 括号 (2.6 节 )。 


2.2 迭 代 


新 手 程序 员 都 会 学 习 使 用 迭代 ， 采 用 某 种 循环 结构 〈( 如 C 语 言 中 的 for 语 句 和 while 语 句 )。 
在 本 节 中 ， 我 们 将 展示 一 个 迭代 算法 的 例子 “选择 排序 "。 在 2.5 节 中 ， 我 们 还 将 通过 归纳 
法 证 明 这 种 算法 确实 能 排序 ， 并 会 在 3.6 节 中 分 析 它 的 运行 时 间 。 在 2.8 节 中 , 我 们 要 展示 如 何 利 
用 递归 设计 一 种 更 加 高 效 的 排序 算法 ， 这 种 算法 使 用 了 一 种 称 作 “分 而 治之 ”的 技巧 。 











常见 主题 ， 自 定义 和 依据 -归纳 


在 学 习 本 章 时 , 大 家 应 该 注意 到 有 两 个 主题 贯穿 多 个 概念 。 第 一 个 是 自 定义 ( self-definition )， 
就 是 指 概念 是 依据 其 自身 定义 或 构建 的 。 全 如， 我 们 提 到 过 ， 表 可 以 定义 为 空 ， 或 一 个 元 素 后 
跟 运 个 示 。 

第 二 个 主题 是 依据 -归纳 (basis-induction )。 递归 函数 通常 都 含有 某 种 针对 不 需要 递归 调用 
的 “依据 ”实例 ， 以 及 需要 一 次 或 多 次 递归 调用 的 “归纳 ”实例 进行 测试 。 众 所 周知 ， 归 纳 证 
明 包 括 依据 和 归纳 步骤 ， 归 纳 定义 也 一 样 。 依 据 - 归 纳 这 一 对 非常 重要 ， 在 后 文中 每 次 出 现 依 
据 情况 或 归纳 步骤 时 ， 都 会 突出 标记 这 些 词语 。 

运用 恰当 的 自 定义 不 会 出 现 悖 论 或 循环 性 ， 因为 自 定义 的 子 部 分 总 是 比 被 定义 的 对 象 “更 
小 ”。 此 外 ， 在 经 过 有 限 个 通 向 更 小 部 分 的 步骤 后 ， 就 能 到 达 依 据 情 况 ， 也 就 是 自 定义 终止 的 
地 方 。 例如， 表 L 是 由 一 个 元 素 和 比 L 少 一 个 元 素 的 表 构 成 的 。 当 我 们 遇 到 没有 元 素 的 表 ， 就 有 
了 表 定 义 的 依据 情况 :“ 空 表 是 表 ”。 

再 举 个 例子 ， 如 果 某 递归 函数 是 有 效 的 ， 那 么 从 某 种 意义 上 讲 ， 某 一 函数 调用 的 参数 必须 
要 比 调用 该 函数 的 函数 副本 的 参数 “更 小 "。 还 有 ， 在 经 过 若干 次 递归 调用 后 ， 我 们 必须 要 让 
参数 “小 到 ”函数 不 再 进行 递归 调用 为 止 。 





2.2.1 排序 
要 排序 具有 个 元 素 的 表 ， 我 们 需要 重新 排 表 中 的 元 素 ， 使 它们 按照 非 递减 顺序 排列 。 
+ 示例 2.1 


假设 有 整数 表 {3，1, 4，1，5，9，2，6，5}。 我 们 要 将 其 重新 排列 成 序列 {1，1，2，3 ,4， 
5，5，6，9}， 实现 对 该 表 的 排序 。 请 注意 ， 排 序 不 仅 会 整理 好 各 值 的 顺序 ， 使 每 个 元 素 的 值 小 
于 等 于 接 下 来 那个 元 素 的 值 ， 而 且 不 会 改变 每 个 值 出 现 的 次 数 。 因 此 ， 排 序 好 的 表 中 有 两 个 1 
和 两 个 5， 而 原 表 中 只 出 现 一 次 的 数字 都 上 只 有 一 个 。 

只 要 表 的 元 素 有 “小 于 ”的 顺序 可 言 , 也 就 是 具备 我 们 通常 用 符号 < 表示 的 关系 ,就 可 对 这 
些 元 素 排序 。 例如， 如 果 这 些 值 是 实数 或 整数 ,那么 符号 < 就 表示 实数 或 整数 的 小 于 关系 ; 如 果 
这 些 值 是 字符 串 ， 就 按 字符 串 的 词典 顺序 来 排列 (“词典 顺序 ”的 介绍 详 见 下 文 附注 栏 ) 有 时 
候 ， 当 元 素 比 较 复 杂 ， 比 如 当 元 素 是 结构 体 时 ， 就 可 能 使 用 每 个 元 素 的 一 部 分 ( 比如 某 个 特定 
字段 ) 来 进行 比较 。 
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词典 顺序 


要 比较 两 个 字符 事 ,， 通常 是 依据 它们 的 词典 顺序 进行 比较 的 。 假设 cic,…cx 和 did)…d, 是 两 
个 字符 囊 ,， 其 中 每 个 c 和 每 个 4 都 只 代表 一 个 字符 。 字 符 囊 的 长 度 k 和 om 不 一 定 是 相同 的 。 我 们 假 
设 对 字符 而 言 也 有 < 顺序 ， 例 如 ， 在 C 语 言 中 ， 字 符 就 是 小 的 整数 ， 所 以 字符 常量 和 字符 变量 
可 以 在 算术 表达 式 中 作为 整数 使 有 用。 因此， 我 们 可 以 使 用 整数 间 惯 有 的 < 关系 ， 区 分 两 个 字符 
中 哪个 字符 “小 于 ” 另 一 个 字符 。 这 种 顺序 包含 这 样 一 个 自然 的 概念 ， 出 现在 字母 表 靠 前 位 置 
的 小 写字 母 ,要 “小 于 ”出 现在 字母 表 中 靠 后 位 置 的 小 写字 母 ， 同 样 的 道理 对 大 写字 母 也 成 立 。 

这 样 我 们 可 以 将 字符 串 的 这 种 顺序 称 为 字典 、 词 典 或 字母 表 顺 序 ， 如 下 所 示 。 如 果 以 下 任 
意 一 条 成 立 的 话 ， 我 们 就 说 clcy…ci< di paQ 

(1) 第 一 个 字符 事 是 第 二 个 字符 串 的 真 前 级 ( proper prefix ), 这 表示 fk<m, 而 且 对 1=1,2，…， 
有 而 言 ， 都 有 c;== qd;。 根 据 这 条 规则 ， 就 有 bat<batter。 作 为 这 条 规则 的 特例 ， 可 能 有 k=0， 
这 样 第 一 个 字符 囊 就 不 含 任何 字符 。 我 们 用 希腊 字母 e 表 示 空 字符 囊 这 种 不 含 字 符 的 字符 串 。 
当 k= 0 时， 规则 (1) 表 示 对 任何 非 空 字符 囊 s 而 言 ， 都 有 Ee < 5s。 

(2) 对 茶 个 i> 0 的 值 ， 两 个 字符 串 的 前 三 1 个 字符 都 相同 ， 但 第 一 个 字符 串 的 第 ;个 字符 要 小 
于 第 二 个 字符 囊 的 第 i 个 字符 。 也 就 是 说 ， 对 j=1, 2,…, i-1， 都 有 jd)， 而 且 ci<di。 根 据 这 条 
规则 , ball<base, 因为 这 两 个 单词 是 从 第 3 个 字母 起 开始 不 同 的 , 而 ball 的 第 三 个 字母 是 1， 
要 比 base 的 第 三 个 字母 s 更 小 。 








4 过 0 这 一 比较 关系 总 是 表示 ， 要 么 ac<p， 要 么 ca 和 0 具有 相同 的 值 。 如 果 w 大 大 … 夺 am， 也 
就 是 说 ， 如 果 这 些 值 有 痢 非 递减 顺序 ， 那 么 我 们 就 说 表 ( a1, a, …, a, ) 是 已 排序 的 。 排 序 征 这 
样 一 种 操作 ， 它 接受 任意 表 (a1, az, .… a, )， 并 生成 满足 如 下 条 件 的 表 (i, D2， .…, b; )。 

(1) 表 (bi, b2,…, ba) 是 已 排序 的 ; 

(2) 表 (51,5s,…,b, ) 是 原 表 的 排列 。 也 就 是 说 ， 表 (a1,a2…,an ) 中 的 每 个 值 出 现 的 次 数 ， 
和 那些 值 出 现在 (i, 5,…,b;) 中 的 次 数 是 一 模 一 样 的 。 

排序 算法 接受 任意 的 表 作为 输入 ， 并 生成 对 输入 进行 过 排列 的 已 排序 表 作 为 输出 。 


+ 示例 2.2 
考虑 base，bal1，mounda，bat，glove，batter 这 列 单词 。 有 了 该 输入 ， 排 序 算法 会 按 
照 词典 顺序 生成 输出 : ball, base, bat, batter, glove, moundo 


2.2.2 选择 排序 : 一 种 迭代 排序 算法 


假设 要 对 一 个 具有 n 个 整数 的 数组 A 按照 非 递 减 顺 序 排序 。 我 们 可 以 通过 对 这 个 步骤 的 迭代 
来 完成 该 工作 : 找 出 尚 不 在 数组 已 排序 部 分 的 一 个 最 小 元 素 ”, 将 其 交换 到 数组 未 排序 部 分 的 第 
一 个 位 置 。 在 第 一 次 迭代 中 ,我们 在 整个 数组 A[0. .n-1] 中 找 出 (“选取 ”) 一 个 最 小 元 素 , 并 
将 其 与 A[10] 互 换 位 置 。“ 在 第 二 次 迭代 中 ,我 们 从 A [1. .n-1] 中 找 出 一 个 最 小 元 素 ， 并 将 其 与 
A[1] 互 换 位 置 。 继 续 进 行 这 种 迭 代 。 在 开始 第 计 1 次 迭代 时 ，A[0. .i-1] 已 经 是 将 A 中 较 小 的 i 














(QD 这 里 说 “一 个 ”最 小 元 素 是 因为 最 小 值 可 能 出 现 多 次 。 如 果 是 这 样 ， 找 到 任何 一 个 最 小 值 就 行 了 。 
@) 为 了 描述 数组 中 某 个 范围 内 的 元 素 , 我 们 采用 了 Pascal 语 言 中 的 约定 。 如 果 4 是 数组 ,那么 A[i. .j] 就 表示 数组 
4 中 下 标 从 i 到 这 个 范围 内 的 那些 元 素 。 
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个 元 素 按 照 非 递 减 顺 序 排序 了 ,而 数组 中 余下 的 元 素 则 没有 特定 的 顺序 。 在 第 计 1 次 迭代 开始 前 
数组 A 的 状态 如 图 2-1 所 示 。 


已 排序 的 未 排序 的 


0 i n—l 


图 2-1 在 进行 选择 排序 的 第 计 1 次 迭代 前 数组 的 示意 图 





对 名 字 与 值 的 约定 
我 们 可 以 将 变量 视 为 具有 名 字 和 值 的 框 。 在 提 到 变量 时 ， 比 如 abc， 我 们 会 使 用 等 宽 字 体 
来 表示 其 名 字 ; 在 提 到 变量 abc 的 值 时 ,我 们 会 使 用 斜体 字 ， 如 apc。 总 之 ，abc 表 示 框 的 名 字 ， 
而 Cpc 则 表示 它 的 内 容 。 





在 第 i+1 次 迭代 中 ， 要 找 出 A[i..n-1] 中 的 一 个 最 小 元 素 ， 并 将 其 与 A[i ] 互 换 位 置 。 
此 ,在 经 过 第 ;+1 次 迭代 之 后 ,AL0..i 已 经 是 将 A 中 较 小 的 1+1 个 元 素 按照 非 递 减 顺序 排序 了 。 
在 经 过 第 z+1 次 迭代 之 后 ， 就 完成 了 对 整个 数组 的 排序 。 

图 2-2 展 示 了 用 C 语 言 编写 的 选择 排序 函数 。 这 个 名 为 SelectionSort 的 函数 接受 数组 A 
作为 其 第 一 个 参数 。 第 二 个 参数 n 表 示 的 是 数组 A 的 长 度 。 





void SelectionSort(int A[], int n) 
{ 
int i, j, small, temp; 
(1) for (i = 0; i < n-i1; i++) { 
/* 将 small 置 为 剩余 最 小 元 素 第 一 次 出 现时 
的 下 标 */ 
2) small = i; 
3) for (j = i+i; j < n; j++) 
4) if (A[j] < A[small]) 
5) small = j; 
/* 到 达 这 里 时 ，small 是 和 [i..n-1] 
中 第 一 个 最 小 元 素 的 下 标 ，*/ 
/* 现 在 交换 A[small] 与 A[i]。 */ 
(6) temp = A[smal1] ; 
) A[small] = A[i]; 
(8) A[i] = temp; 











图 2-2 ”迭代 的 选择 排序 


第 (2) 到 ($) 这 几 行 程序 从 数组 未 排序 的 部 分 AIi. .n-1]1 中 选取 一 个 最 小 元 素 。 我 们 首先 在 
第 (2) 行 中 将 下 标 smal1 的 值 设 为 i。 第 (3) 到 (5) 这 几 行 的 for 循 环 会 依次 考量 所 有 更 高 的 下 标 j， 
如 果 A[j] 的 值 小 于 A[i. .j-1] 这 个 范围 内 的 任何 数组 元 素 的 值 ， 那么 就 将 smal! 置 为 j。 这 样 一 
来 ， 我 们 就 将 变量 smal1 的 值 置 为 Ari . .n-1] 中 最 先 出 现 的 那个 最 小 元 素 的 下 标 了 。 

在 为 下 标 small 选 好 值 后 ， 在 第 (6) 到 (8) 行 中 ， 我 们 要 将 处 于 该 位 置 的 元 素 与 A[i] 处 的 元 
素 互 换 位 置 。 如 果 small=i， 交 换 还 是 会 进行 ， 只 是 对 数组 没有 任何 影响 。 请 注意 ， 要 交换 两 个 
元 素 的 位 置 ， 还 需要 一 个 临时 的 位 置 来 存储 二 者 之 一 。 因 此 ， 我 们 在 第 (6) 行 将 A[small] 里 的 
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值 移 到 temp 中 , 并 在 第 (7) 行 将 A[i] 里 的 值 移 到 A[small] 中 , 最 终 在 第 (8) 行 将 原来 A[ small] 
里 的 值 从 temp 移 到 A[i] 中 。 


+ 示例 2.3 

我 们 来 研究 一 下 SelectionSort 针 对 各 种 输入 的 行为 。 首 先 看 看 运行 SelectionSort 
处 理 没有 元 素 的 数组 时 会 发 生 什 么 。 当 n = 0 时 ， 第 (1) 行 中 的 for 循 环 的 主体 不 会 执行 ， 所 以 
SelectionSort 很 从 容 地 “什么 事 都 没 做 ”。 

现在 考虑 一 下 数组 只 有 一 个 元 素 的 情况 。 这 次 第 (1) 行 中 的 for 循 环 的 主体 还 是 不 会 执行 ， 
这 种 反应 是 令 人 满意 的 , 因为 由 一 个 元 素 组 成 的 数组 始终 是 已 排序 的 。 当 n 为 0 或 1 时 的 情况 是 重 
要 的 边界 条 件 ， 检 测 这 些 条 件 下 算法 或 程序 的 性 能 是 很 重要 的 。 

最 后 , 我 们 要 运行 SelectionSort, 处 理 一 个 具有 4 个 元 素 的 较 小 数组 , 其 中 A[0] 到 A[3] 


分 别 是 











0 1 2 3 


A |40|30|20|10 
我 们 从 六 0 起 开始 外 层 的 循环 , 并 在 第 (2) 行 将 smal11 置 为 0。 第 (3) 到 (5) 行 构成 了 内 层 的 循环 ， 
在 该 循环 中 ，j 依 次 被 置 为 !、2 和 3。 对 于 /= 1， 第 (4) 行 的 条 件 是 成 立 的 ， 因 为 4[1]， 也 就 是 30， 
要 小 于 4[smal1]， 即 4[0]， 或 者 说 是 40。 因 此 ， 在 第 (5) 行 我 们 会 将 smal1 置 为 1。 在 (3) 至 (5) 行 第 
二 次 迭代 时 ， 有 7=2， 第 (4) 行 的 条 件 还 是 成 立 ， 因 为 4[2]<4[1]， 所 以 我 们 在 第 (5) 行 将 small 置 
为 2。 在 第 (3) 到 (5) 行 的 最 后 一 次 迭代 中 ， 有 j = 3， 第 (4) 行 的 条 件 依 旧 成 立 ， 因 为 4[3]<4[2]， 所 
以 在 第 (5) 行 将 small 置 为 3。 
现在 我 们 跳出 内 层 循环 ， 到 达 第 (6) 行 。 将 4[smal1]( 即 10 ) 赋 给 temp， 接 着 在 第 (7) 行 ， 
将 4[0] (也 就 是 40 ) 赋 给 A[3] ， 然 后 在 第 (8) 行 将 10 赋 给 A[0] 。 现 在 ， 外 层 循环 的 第 一 次 欠 代 
已 经 完成 ， 而 此 时 的 数组 A 就 变 成 下 面 这 样 了 
0 1 2 3 


A |10|30|20|40 
外 层 循环 进行 第 二 次 迭代 时 ， 有 i= 1, 在 第 (2) 行 将 smal1 置 为 1。 内 层 循环 起 初 会 将 j 置 为 
2， 而 因为 4[2] < 4[1]， 第 (5) 行 会 将 small1 置 为 2。 对 7/ = 3， 第 (4) 行 的 条 件 不 成 立 ， 因 为 4[3]= 
A[2]。 因 此 ， 在 到 达 第 (6) 行 时 ， 就 有 smal/!=2。 第 (6) 到 (8) 行 会 交换 A[1] 和 A[2]， 计 数组 变 成 
0 1 2 3 


A 10120 130140 
虽然 数组 现在 正好 已 排序 了 ， 但 我 们 还 是 要 迭代 一 次 外 层 循环 ， 这 时 := 2。 我 们 在 第 (2) 行 
将 small 置 为 2， 内 层 循 环 此 时 按照 i = 3 的 情况 来 执行 。 因 为 第 (4) 行 的 条 件 不 成 立 ，small 依 旧 
为 2， 而 在 第 (6) 到 (8) 行 中 ， 我 们 会 将 A[21 与 其 自 刁 “进行 交换 ”"。 大 家 应 该 确认 ， 当 smal 三 时 ， 
这 种 交换 是 没有 效果 的 。 




















键 排序 


在 排序 时 ,我 们 会 对 要 排序 的 值 进行 比较 操作 。 通 常 只 对 值 的 特定 部 分 进行 比较 ,而 用 于 
比较 的 这 个 部 分 就 称 为 键 。 
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例如 ， 课 表 可 能 是 具有 如 下 形式 的 C 语 言 结 构 体 数组 和 


struct STUDENT { 
int studentID; 
char *name; 
char grade; 

上 ALMAX] ; 


我 们 可 角 re 、 学 生 姓 名 或 所 在 年 级 来 排序 ,每 项 内 容 都 可 以 作为 键 。 例 如， 如 
果 我 们 希望 通 学 号 为 结构 体 排序 ， 就 可 以 在 SelectionSort 的 第 (4) 行 进行 如 下 比较: 

A[j] .studentID < A[small] .studentID 

数组 A 和 交换 中 使 用 的 临时 变量 temp 都 是 struct STUDENT 类 型 ， 而 不 是 intedger 类 型 
的 。 请 注意 ， 整 个 结构 体 都 要 进行 交换 ， 而 不 仅仅 是 交换 键 字段 。 

交换 整个 结构 体 是 很 费时 的 ,所 以 产生 了 一 种 更 有 效率 的 方法 ， 即 使 用 的 另 一 个 元 素 是 指 
向 STUDENT 结构 体 的 指针 的 数组 , 并 且 只 为 第 二 个 数组 中 的 指针 排序 , 结构 体 本 身 在 第 一 个 数 
组 中 保持 不 变 。 我 们 将 这 种 方式 的 选择 排序 留 作 本 节 的 习题 。 




















图 2-3 展 示 了 SelectionSsort 图 数 如 何 应 用 到 完整 的 程序 中 ,来 给 含有 7 (这 里 约定 7 大 
100 ) 个 整数 的 序列 排序 。 第 (1) 行 会 读 取 并 存储 数组 A 中 的 n 个 整数 。 os 只 有 前 
MAX 个 整数 被 装 CI- 提供 一 条 消息 警告 用 户 输入 的 数字 过 大 在 这 里 可 能 很 实用 , 不 过 我 们 
先 不 考虑 这 一 点 。 








#include <stdio.h> 


#define MAX 100 
int A[MAX]; 
void SelectionSort(int A[], int n); 


main() 
{ 
int i, n; 
/* 在 和 A 中 读 取 和 存储 输入 */ 
for (n= 0; n < MAX && scanf("%d", &A[n]) != EOF; n++) 


SelectionSort(A,n);/* 排序 入 */ 
for (i = 0; i < ni i++) 
printf("%d\n", A[i]); /* 打印 A */ 


By pt ,pt 
CO 
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} 
void SelectionSort(int A[], int n) 
{ 
int i, j, small, temp; 
for (i = 0; i < n-i; i++) { 
small = i; 
for (j = i+l; j < n; j++) 
if (A[j] < ALsmal1]) 
small = j; 
temp = ALsmal1] ; 
A[small] = A[i]; 
Ar[i] = temp; 
} 
} 





图 2-3 ”使 用 选择 排序 的 排序 程序 
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第 (3) 行 调用 selectionSort 来 为 数组 排序 。 第 (4) 行 和 第 (5) 行 会 按照 排 好 的 顺序 将 这 些 整 
数 打 印 出 来 。 


2.2.3 习题 


(1) 假设 用 Se] ecti onSort 国 数 来 处 理 包 含 如 下 几 组 元 素 的 数组 : 
(a) 6, 8, 14, 17, 23 
(b) 17, 23, 14, 6, 8 
(c) 23, 17, 14, 8, 6 
在 每 种 情况 下 ， 分 别 会 发 生 多 少 次 元 素 的 比较 和 交换 ? 

(2) ** 在 为 具有 7 个 元 素 的 序列 排序 时 ，SelectionSort 进 行 (8 比较 和 (b) 交 换 的 最 少 次 数 及 最 多 次 
数 分 别 是 多 少 ? 

(3) 编写 C 语 言 印 数 ， 接 受 两 个 字符 链表 作为 参数 ， 如 果 第 一 个 字符 串 在 词典 顺序 上 先 于 第 二 个 字符 串 ， 
就 返回 TRUE。 提示 : 实现 本 节 中 描述 的 字符 串 比 较 算法 。 当 两 个 字符 串 前 面 的 字符 相同 时 ， 通 过 在 
字符 串 尾 部 让 该 函数 调用 自身 进行 递归 。 除 此 之 外 ， 大 家 还 可 以 设计 迭代 算法 完成 同样 的 工作 。 

(4)* 修改 习题 (3) 中 的 程序 ， 使 其 在 比较 过 程 中 忽略 字母 的 大 小 写 。 

(5) 如 果 所 有 元 素 都 相同 ， 选 择 排序 会 做 些 什么 ? 

(6) 修改 图 2-3 中 的 程序 ， 使 其 在 数组 元 素 不 是 整数 而 是 类 型 为 struct STUDENT 的 结构 体 时 执行 选 
择 排 序 ， 就 像 前 文 附注 栏 “ 键 排序 ”中 所 定义 的 那样 。 假 设 键 字段 是 student 

(7) * 进一步 修改 图 2-3， 使 其 能 为 任意 类 型 7 的 元 素 排 序 。 不 过 ， 大 家 可 以 假设 某 个 函数 key 可 以 接受 
某 个 类 型 为 7 的 元 素 作为 参数 , 并 为 该 元 素 返 回 某 个 任意 类 型 K 的 键 。 还 假设 有 函数 1 接受 类 型 为 K 
的 两 个 元 素 作 为 参数 ， 且 若 第 一 个 元 素 “ 小 于 ”第 二 个 元 素 ， 就 返回 TRUE， 否 则 返回 FALSE。 

(8) 除了 在 数组 A 中 使 用 整数 下 标 ， 还 可 以 使 用 指向 整数 的 指针 表示 数组 中 的 位 置 。 使 用 指针 重 写 图 
2-3 中 的 选择 排序 算法 。 

(9) * 正如 在 前 文 附注 栏 “ 键 排序 ”中 提 到 的 ， 如 果 要 排序 的 元 素 是 诸如 类 型 STUDENT 这 样 的 大 型 结 
构 体 , 我 们 可 以 将 它们 留 在 原 数 组 中 保持 原样 , 并 在 第 二 个 数组 中 对 指向 这 些 结构 体 的 指针 排序 。 
写 下 选择 排序 的 这 种 变形 。 

(10) 写 一 个 迭代 程序 ， 打 印 一 个 整数 数组 中 的 不 同 元 素 。 

(11) 使 用 本 章 开始 部 分 所 描述 的 符号 和 I 来 表示 以 下 内 容 。 

(a) 1 到 377 中 所 有 奇数 的 和 。 
(b) 2 到 nn 假设 n 是 侦 数 ) 中 所 有 偶数 的 平方 的 和 。 
(c) 8 到 2 中 所 有 2 的 n 次 智 的 积 。 
(12) 证 明 当 small = 时， 图 2-2 中 的 第 (6) 到 (8) 行 ( 进行 交换 的 步骤 ) 对 数组 A 没有 任何 影响 。 
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数学 归纳 法 是 种 实用 的 技巧 ， 可 用 来 证 明 命题 S(n) 对 所 有 非 负 整数 都 为 真 ， 或 者 更 一 般 
地 说 ， 对 所 有 不 小 于 某 个 下 限 的 整数 都 成 立 。 例 如 , 在 本 章 开 头 ， 我 们 提 到 过 可 以 通过 对 m 的 归 
纳 ， 证 明 对 于 所 有 的 n 宇 1, 命题 >》 i=n(n+1)/2 都 为 真 。 

现在 , 假设 S$(n) 是 有 关 整 数 z 的 任意 命题 。 在 对 命题 S(n) 最 简单 的 归纳 证 明 形式 中 ， 要 证 
明 以 下 两 个 事实 。 

(1) 依据 情况 。 多 为 5(0) ,不 过 ,依据 可 以 是 对 应 任意 整数 k 的 S(K) ， 这 样 就 是 证 明 只 有 在 
n 宇 Kk 时 命题 S(n) 成 立 。 
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(2) 归纳 步骤 。 我 们 要 证 明 对 所 有 的 n 宇 0 (或 者 如 果 依 据 为 SCX) ， 则 是 对 所 有 的 nn 三 )， 
都 可 由 S(n) 推 出 SGn+1)。 在 证 明 过 程 中 的 这 个 部 分 , 我 们 假设 命题 S(n) 为 真 。S(n) 称 为 归纳 
假设 ,而 且 要 假设 它 为 真 ， 接 着 我 们 必须 证 明 S(n+1) 为 真 。 





命名 归纳 参数 
我 们 可 以 通过 为 要 证 明 的 命题 S(n) 中 的 变量 1 指定 直观 含义 ， 对 归纳 作出 解释 ， 这 种 做 法 
通常 很 有 有 用。 如果 1m 如 示例 2-4 中 那样 没有 特殊 含义 ， 就 可 以 说 “对 1 进行 归纳 证 明 "。 在 其 他 例 
子 中 ,nn 可 能 具有 实际 意义 ， 比 如 示例 2.6 中 ，n 表 示 码 字 中 的 比特 数 ， 于 是 就 可 以 说 ,“ 对 码 字 
中 的 i 归纳 证 明 ”。 








图 2-4 展 示 了 从 0 开始 的 归纳 。 对 每 个 整数 上 ， 都 有 命题 S(n) 要 证 明 。 对 SQ) 的 证 明 用 到 了 
S(0) ， 对 S(2) 的 证 明 用 到 了 SG) ， 以 此 类 推 ， 就 如 图 中 箭头 所 表示 的 。 每 个 命题 依赖 前 一 个 命 
题 的 方式 是 统一 的 。 也 就 是 说 ,通过 对 归纳 步骤 的 一 次 证 明 ， 我 们 可 以 证 明 图 2-4 中 箭头 表示 的 


每 个 步骤 。 


图 2-4 ”在 归纳 证 明 中 ,命题 S(n) 的 每 个 实例 都 是 用 比 n 的 值 小 1 的 命题 实例 证 明 的 


+ 示例 2 
0 我 们 来 证 明 如 下 命题 S(n) 


命题 。 对 任意 的 n 三 0 ， 都 有 S(n) : 六 2 =2" -1 


这 就 是 说 ， 从 2 的 0 次 需 到 2 的 2 次 震 ， ;的 整 燃 数 指数 寡 之 和 要 比 2 的 2+1 次 震 小 1?。 例 如 ， 
1+2+4+8 = 16-1， 证 明 过 程 如 下 。 
依据 。 要 证 明 该 依据 ， 我 们 将 等 式 S(n) 中 的 xz 蔷 换 为 0， 这 样 S(n) 就 成 了 


0 
>,2 =2 -1 (2.2) 
i=0 


对 i=0 ， 等 式 (2.2) 左 边 的 和 式 中 只 有 一 项 ， 这 样 (2.2) 左 边 的 和 为 2>， 也 就 是 1。 而 等 式 (2.2) 
右边 是 2 -1， 也 就 是 2-1 ， 其 值 同样 是 1。 因 此 我 们 证 明了 S(n) 的 依据 ， 也 就 是 说 ， 我 们 证 明 
了 对 于 n=0 ， 该 等 式 成 立 。 

归纳 。 现 在 必须 要 证 明 归 纳 步 又 。 我 们 假设 S(n) 为 真 , 并 证 明 将 该 等 式 中 的 xz 茶 换 为 2+1 后 
等 式 也 成 立 。 要 证 明 的 等 式 S(n+1) 如 下 


n+l 


221 (2.3) 
i=0 








@ 证 明 S(n) 也 可 以 不 使 用 归纳 法 ， 只 需要 利用 几何 级 数 的 求 和 公式 即 可 。 不 过 ， 该 示例 可 以 作为 介绍 数学 归纳 法 
的 简单 例子 。 此 外 ， 利 用 我 们 在 高 中 可 能 见 过 的 几何 级 数 或 算术 级 数 求 和 公式 来 证 明 该 命题 是 相当 不 严谨 的 ， 
而 且 严 格 地 讲 ， 证 明 这 些 求 和 公式 也 要 用 到 数学 归纳 法 。 
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要 证 明 等 式 (2.3) 成 立 ， 我 们 先 要 考虑 等 式 左 侧 的 和 


这 个 和 几乎 与 S$(n) 左 侧 的 和 一 模 一 样 ，S(n) 左 侧 的 和 为 

只 不 过 等 式 (2.3) 左 侧 多 了 i=n+1 时 的 项 ， 也 就 是 2"" 这 一 项 。 

因为 可 以 假定 归纳 假设 S(n) 在 等 式 (2.3) 的 证 明 过 程 中 为 真 ， 所 以 应 该 将 S(n) 利用 起 来 。 可 
以 将 等 式 (2.3) 中 的 和 分 为 两 个 部 分 , 其 中 之 一 是 Sn) 中 的 和 。 也 就 是 说 , 要 将 i=n+1 时 的 最 后 
一 项 分 离 出 来 ， 将 其 写 为 





$y = y2 De (2.4) 
现在 可 以 利用 S(n) 了 ， 可 以 用 S(n) 的 右边 2”" -1 来 替换 等 式 (2.4) 中 的 2 ， 于 是 有 
$y Ep rp (2.5) 


将 等 式 (2.5) 的 右边 简化 后 ， 它 就 成 了 2x2"”" -1,， 也 就 是 2 -1。 现 在 可 以 看 到 ， 等 式 (2.5) 
左 侧 的 和 值 ， 与 等 式 (2.3) 的 左边 相同 ， 而 等 式 (2.5) 的 右边 也 与 等 式 (2.3) 的 右边 相同 。 因 此 ， 就 
利用 等 式 S(n) 证 明了 等 式 (2.3) 的 正确 性 , 这 段 证 明 过 程 就 是 归纳 步骤 ,由 此 得 出 的 结论 是 , S(n) 
对 每 个 非 负 整数 n 都 成 立 。 


2.3.1 ”归纳 证 阴 为 何 有 效 





变量 的 替换 
在 需要 替换 变量 ， 比 如 涉及 同一 变量 的 表达 式 ， 如 S(z) 中 的 n 时 ， 常 会 产生 混淆 。 例 如 ， 
我 们 要 用 1+1 替 换 8(o) 中 的 n， 以 得 出 等 式 (2.3)。 要 进行 这 种 蔡 换 ， 必 须 先 标记 出 S 中 每 个 出 


现 n 的 地 方 。 有 个 很 实用 的 办 法 ， 就 是 先 用 某 个 未 在 S 中 出 现 过 的 新 变量 ( 比如 m ) 来 代替 n。 
例如 ，S(n) 就 成 了 


pe = Am -1] 
i=0 
接着 在 每 个 出 现 m 的 地 方 将 其 蔡 换 成 所 需 的 表达 式 ， 即 本 例 中 的 nt1， 就 得 到 
>- =20 +D+l 


若 将 (n+l ) +1 简 化 为 n +2， 泣 术 地 党 稀 已 反 )。 

请 注意 ,我 们 应 该 给 用 来 替换 的 表达 式 加 上 括号 ， 以 避免 意外 改变 运算 顺序 。 例如 ,假设 
用 n+1 替 换 表 达 式 2xm 中 的 m， 但 没有 给 n+1 加 上 括号 ， 那 么 就 会 得 到 2xn+]1， 而 不 是 正确 
的 表达 式 2x(n+1) (也 就 是 2xn+2 )。 





在 归纳 证 明 中 ， 我 们 先 证 明了 S(0) 为 真 。 接 下 来 要 证 明 ， 如 果 S(n) 为 真 ， 那么 SCn+1) 是 
成 立 的 。 不 过 为 什么 接着 能 得 出 S(n) 对 所 有 nn 三 0 都 为 真 呢 ?” 我 们 会 提供 两 个 “证 据 ”。 某 位 数 
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学 家 曾 指出 , 我 们 证 实 归纳 法 有 效 的 每 个 “证 据 ”, 都 需要 归纳 证 据 本 身 , 因此 就 根本 没有 证 据 。 
从 技术 上 讲 ， 归 纳 肯定 能 作为 公理 ,然而 很 多 人 会 发 现 以 下 直觉 认识 也 是 有 用 的 。 

在 接 下 来 的 内 容 中 ,我们 假设 作为 依据 的 值 是 n=0 。 也 就 是 说 ， 我 们 知道 8(0) 为 真 ， 而 且 
对 于 所 有 大 于 0 的 x， 如果 S(n) 为 真 , 那么 SCn+1) 为 真 。 如果 作 为 依据 的 值 是 其 他 整数 ,也 可 以 
做 出 类 似 的 论证 。 

第 一 个 “证 据 ”: 归纳 步骤 的 和 迭代。 假设 要 证 明 对 某 个 特定 的 非 负 整 数 wx 有 8(a) 为 真 。 如 果 
4a=0 ， 只 要 援引 归纳 依据 5S(0) 的 真实 性 即 可 。 如 果 a > 0 ,那么 就 要 进行 如 下 论证 。 从 归纳 依 
据 可 知 S(0) 为 真 。 对 于 命题 “S(n) 可 推出 Snt+1)”, 车 将 n 蔡 换 为 0, 就 成 了 “S(0) 可 推出 SG ”。 
因为 我 们 知道 $(0) 为 真 ,现在 就 知道 $0) 为 真 ,类 似 地 ,如 果 用 1 蔡 换 n ,就 有 “SQ) 可 推出 S$(2)”， 
这 样 一 来 就 知道 8(C2) 也 为 真 。 用 2 来 蔡 换 n， 则 有 “SC2) 可 推出 SG)”， 所 以 SG) 也 为 真 ， 以 此 
类 推 。 不 管 a 取 什么 值 ， 最 终 都 能 得 到 S(a) ， 这 样 就 完成 了 归纳 。 

第 二 个 “证 据 ”: 最 少 反例 。 假设 至 少 有 一 个 n 的 值 可 以 使 S(n) 不 为 真 。 设 a 是 令 S(a) 为 假 的 
最 小 非 负 整数 。 如 果 a=0 ， 就 与 我 们 的 归纳 依据 S(0) 相互 矛盾 ， 所 以 一定 是 大 于 0 的 。 不 过 如 果 
a >0，, 而 且 a 是 令 8(a) 为 假 的 最 小 非 负 整数 , 那么 S(a) 肯定 为 真 。 现 在, 在 归纳 步骤 中 ， 如 果 用 
a 一 1 代替 n, 就 会 有 S(a 一 ]) 可 推出 S(a)。 因 为 S(a 一 ]) 为 真 , 那么 S(a) 肯定 为 真 ， 又 相互 让 盾 了 。 
因为 我 们 假设 存在 非 负 整数 n 使 S(n) 为 假 ， 并 引出 了 了 矛盾， 所 以 S(n) 对 任何 三 0 都 一 定 为 真 。 


2.3.2 ” 检 错 码 


现在 我 们 要 介绍 “ 检 错 码 ” 的 例子 。 检 和 错 码 本 身 就 是 个 有 意思 的 概念 ， 而 且 引 出 了 一 段 有 
趣 的 归纳 证 明 。 当 我 们 通过 数据 网 络 传输 信息 时 ， 会 将 字符 ( 字母 、 数 字 、 标 点 符号 ， 等 等 ) 
编码 成 位 串 ， 即 0 和 1 组 成 的 序列 。 此 时 假设 字符 是 由 7 位 表示 的 。 不 过 通常 每 个 字符 要 传输 不 止 
7 位 ， 而 第 8 位 可 以 用 来 检测 一 些 简单 的 传输 错误 。 也 就 是 说 ， 偶 尔 有 那么 一 个 0 或 1 会 因为 传输 
噪声 发 生 改 变 ， 结 果 接 收 到 的 就 是 相反 的 位 ， 进 入 传输 线路 的 0 成 了 1， 而 1 成 了 0。 如 果 通 信 系 
统 能 在 8 位 中 的 一 位 发 生变 化 时 发 出 通知 ， 从 而 发 出 重 传 信号 ， 将 会 很 有 用 。 

要 检测 某 一 位 的 改变 ， 必 须 保 证 任意 两 个 表示 不 同 字 符 的 位 序列 不 只 有 一 个 位 置 不 同 。 不 
然 的 话 ， 如 果 那 个 位 置 发 生变 化 ， 结 果 就 成 了 代表 另 一 个 字符 的 代码 ， 可 能 将 没 法 检测 到 错误 
的 发 生 。 例 如 ， 如 果 一 个 字符 使 用 位 序列 01010101 表 示 ， 而 另 一 个 由 01000101 表 示 ， 那 么 如 果 
左 起 第 4 个 位 置 发 生 改变 ， 就 会 将 前 者 变 成 后 者 。 

要 确保 不 同 字符 的 代码 不 只 有 一 个 位 置 不 同 ,方法 之 一 是 在 惯用 于 表示 字符 的 7 位 码 前 加 上 
一 个 奇偶 校 验 位 。 如 果 位 序列 中 有 奇数 个 1， 则 称 其 具有 奇 校 验 。 如 有 果 位 序列 中 有 偶数 个 1， 则 
其 具有 偶 校 验 。 我们 选择 的 编码 方式 是 以 具有 偶 校 验 的 8 位 码 来 表示 字符 , 也 可 以 选用 带 奇 校 验 
的 代码 。 通 过 明智 地 选择 校 验 位 ， 我 们 可 使 奇偶 校 验 成 为 偶 校 验 。 


+ 示例 2.5 

用 来 表示 字符 A 的 传统 的 ASCII ( 音 “ask-ee”， 表 示 American Standard Code for Information 
Exchange， 即 “美国 信息 交换 标准 码 ”) 7 位 码 是 1000001。 该 序列 的 7 位 中 已 经 有 偶数 个 1， 所 以 
我 们 为 其 加 上 前 级 0， 得 到 01000001。 用 来 表示 c 的 传统 代码 是 1000011， 这 和 表示 A 的 7 位 码 只 
在 第 6 位 是 不 同 的 。 不 过 ， 这 个 代码 具有 奇 校 验 ， 所 以 我 们 给 它 加 上 前 缀 1， 从 而 产生 具有 偶 校 
验 的 8 位 码 11000011。 请 注意 ,在 给 表示 A 和 C 的 代码 前 加 上 校 验 位 后 ,就 有 了 01000001 和 11000011 
这 两 个 位 序列 ， 它 们 的 第 1 位 和 第 7 位 这 两 位 是 不 同 的 ， 如 图 2-5 所 示 。 
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图 2-5 ”可 以 选择 初始 奇偶 校 验 位 ， 使 得 8 位 码 总 是 具有 侦 校 验 


我 们 总 是 能 选择 一 个 奇偶 校 验 位 加 到 7 位 码 上 , 从 而 让 得 到 的 8 位 码 中 有 偶数 个 1。 如果 表示 
字符 的 7 位 码 本 来 就 有 偶 校 验 , 就 选择 0 作为 其 奇偶 校 验 位 ， 而 对 本 具有 奇 校 验 的 7 位 码 , 则 是 选 
择 奇 偶 校 验 位 1。 不 管 哪 种 情况 ，8 位 码 中 都 是 包含 偶数 个 1。 

两 个 具有 偶 校 验 的 位 序列 不 可 能 只 有 一 个 位 置 不 同 。 如 果 两 个 这 样 的 位 序列 只 有 一 个 位 置 








不 同 , 那么 其 中 一 个 肯定 要 比 另 一 个 多 一 个 1。 因 此 , 一 个 序列 必然 具有 奇 校 验 ， 而 另 一 个 则 是 
偶 校 验 , 与 我 们 都 具有 偶 校 验 的 假设 是 天 盾 的 。 因 此 可 得 , 通过 加 上 奇偶 校 验 位 使 1 的 数量 为 偶 ， 
可 为 字符 创建 检 错 码 。 





奇偶 校 验 位 模式 是 相当 “高 效 ” 的 ， 从 某 种 意义 上 讲 ， 它 让 我 们 可 以 传输 很 多 不 同 的 字符 。 
请 注意 ，n 位 的 位 序列 有 >" 个 ， 因 为 我 们 可 以 为 第 一 位 选择 二 值 ( 0 或 1 ) 之 一 ， 可 以 为 第 二 位 选 
择 二 值 之 一 ， 等 等 ， 总 共 可 形成 2 x 2 x… x 2 (7 个 2 相 乘 ) 个 位 串 ， 所 以 ， 最 多 有 望 能 用 8 位 来 
表示 2 = 256 个 字符 。 

然而 ,在 奇偶 校 验 模式 中 ， 只 能 选择 其 中 7 位 ,第 8 位 是 无 从 选择 的 。 因 此 最 多 可 以 表示 2”， 
即 128 个 字符 ,而 且 能 检测 某 一 位 上 的 错误 。 这样 也 不 错 , 我 们 可 以 用 256 个 中 的 128 个 ,也 就 是 
8 位 码 所 有 可 能 组 合 的 一 半 ， 来 作为 字符 的 合法 代码 ， 还 能 检测 某 一 位 中 出 现 的 错误 。 

类 似 地 ， 如 果 我 们 使 用 n 位 的 位 序列 ， 选 择 其 中 一 位 作为 奇偶 校 验 位 ， 那 么 就 能 用 -1 位 
的 位 序列 加 上 合适 的 奇偶 校 验 位 前 级 ( 其 值 由 另外 那 -1 位 确定 ) 来 表示 2 个 字符 。n 位 的 位 
序列 有 2 个 ,我 们 可 以 表示 2 中 的 2 个 , 或 者 说 是 可 能 字符 数 的 一 半 ， 而 且 可 以 检测 位 序列 
中 任意 一 位 的 错误 。 

有 没有 可 能 检测 多 个 错误 ， 并 使 用 超过 位 序列 多 于 一 半 的 可 能 组 合作 为 合法 代码 呢 ? 下 一 
个 例子 将 告诉 你 这 是 不 可 能 的 。 这 里 的 归纳 证 明 使 用 的 命题 对 0 来 说 不 为 真 , 所 以 我 们 必须 选用 
一 个 更 大 的 归纳 依据 ， 也 就 是 1。 


+ 示例 2.6 

我 们 要 对 7 进行 归纳 ， 以 证 明 以 下 命题 。 

命题 S(n) 。 如 果 C 是 长 度 为 n 的 位 串 的 检 错 ( 即 两 个 不 同 的 位 串 不 会 刚好 只 有 一 个 位 置 不 同 ) 
集合 ， 那 么 C 最 多 含有 2” 个 位 串 。 

这 个 命题 对 n= 0 来 说 不 为 真 。 S(0) 表示 长 度 为 0 的 位 串 的 检 错 集合 最 多 只 有 2- 个 ， 也 就 
是 半 个 位 串 。 从 技术 上 讲 ， 只 由 空位 串 〈 不 含 任 何 位 置 的 位 串 ) 组 成 的 集合 C， 是 长 度 为 0 的 位 
串 的 检 错 集合 ,因为 C 中 任意 两 个 位 串 不 会 只 有 一 个 位 置 不 同 。 集 合 C 中 不 只 是 有 半 个 位 串 ， 它 
其 实 有 一 个 位 串 。 因 此 ，S(0) 为 假 。 不 过 ， 对 于 所 有 的 n 三 1，S(n) 都 为 真 ， 正 如 我 们 在 下 文 
将 会 看 到 的 。 

依据 ,依据 为 SQ) , 也 就 是 , 任何 检 错 的 长 度 为 1 的 位 串 的 集合 最 多 只 有 2” =2" =1 个 位 串 。 
长 度 为 1 的 位 串 只 有 两 个 , 一 个 是 位 串 0, 一 个 是 位 串 1。 然而 ,在 检 错 的 集合 中 ,我们 不 能 同时 
拥有 这 两 者 ， 因 为 它们 正好 只 有 一 个 位 置 不 同 。 因 此 ， 每 个 n= 1 的 检 错 集合 肯定 最 多 只 有 一 个 
位 串 。 

归纳 , 设 n 宇 1 ,假定 归纳 假设 一 一 长 度 为 xz 的 位 串 的 检 错 集合 最 多 只 有 2 汪 个 位 串 一 一 为 真 。 
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我 们 必须 用 这 一 假设 证 明 ， 任 何 长 度 为 2+1 的 位 串 的 检 错 集合 C 最 多 只 有 2 个 位 串 。 因 此 ,将 C 
分 为 两 个 集合 : Co， 即 C 中 0 开头 的 位 串 组 成 的 集合 ， 以 及 CI， 即 C 中 1 开头 的 位 串 组 成 的 集合 。 
例如 ,假设 n= 2 ，C 就 是 长 度 为 2+1 =3， 而 且 有 一 个 奇偶 校 验 位 的 位 串 的 集合 。 那 么 ， 如 图 2-6 
所 示 ，C 由 位 串 000、101、110 和 011 组 成 ，Co 由 位 串 000 和 011 组 成 ，C 则 由 位 串 101 和 110 组 成 。 








图 2-6 集合 C 被 分 为 0 开头 位 串 的 集合 Co 和 1 开头 位 串 的 集合 C1，Do 和 D1 则 分 别 由 删 
除了 开头 的 0 和 1 的 位 串 组 成 


考虑 一 下 集合 D。， 它 含有 删除 了 Co 中 那些 位 串 开头 的 0 后 形成 的 位 串 。 在 上 面 的 例子 中 ， 
Do 含有 位 串 00 和 11。 我 们 要 求 Du 不 能 含有 两 个 只 有 一 位 不 同 的 位 串 。 原 因 在 于 ， 如 果 有 这 样 两 
个 位 串 ， 比 方 说 qiay…a 和 515，…b,， 然后 恢复 它们 开头 的 0， 就 会 给 出 两 个 Co 中 的 位 串 ，0a1a>… 
a 和 0b1b，…pb,,， 而 这 两 个 位 串 也 只 有 一 位 是 不 同 的 。 不 过 Co 中 的 位 串 也 是 C 中 的 元 素 ， 而 且 我 们 
知道 C 中 不 能 有 两 个 位 串 只 有 一 个 位 置 不 同 。 因 此 ，Do 也 不 行 ， 所 以 Do 是 检 错 集合 。 

现在 可 以 应 用 该 归纳 假设 得 出 , Do 作为 一 个 长 度 为 n 的 位 串 的 检 错 集合 , 最 多 有 2” 个 位 串 。 
因此 ，Co 最 多 有 2 一个 位 串 。 

同样 ,可 以 对 CI 集合 作出 类 似 推论 。 设 疡 集合 内 的 元 素 是 删除 Ci 中 位 串 开头 的 1 形成 的 位 串 。 
刀 是 长 度 为 z 的 位 串 的 检 错 集合 ， 而 根据 归纳 假设 ，Di 最 多 只 有 2” 个 位 串 。 因 此 ，Ci 也 最 多 只 
有 2” 个 位 串 。 然 而 ，C 中 的 每 个 位 串 不 是 在 Co 中 就 是 在 Ci 中 。 因 此 ，C 中 最 多 有 2 + 2 一 个 ， 
也 就 是 2" 个 位 串 。 

我 们 已 经 证 明了 S(n) 可 推出 Sn+1) ， 所 以 可 以 得 出 结论 ，S(n) 对 所 有 的 n 宇 1 都 为 真 。 我 
们 在 声明 中 排除 了 n= 0 的 情况 ， 因 为 归纳 依据 是 n=1， 而 不 是 n= 0 。 现 在 看 到 带 奇偶 校 验 检 
查 的 检 错 集合 是 尽 可 能 大 的 ， 因 为 它们 在 使 用 n 个 位 来 构成 位 串 时 能 有 2” 个 位 串 。 

















如 何 构造 归纳 证 明 
没有 什么 可 以 保证 给 出 任意 ( 真 ) 命题 S(n) 的 归纳 证 明 。 找 到 归纳 证 明 ， 就 像 找到 任意 
类 型 的 证 明 那 样 ， 或 者 就 像 写 出 能 正常 运行 的 程序 那样 ， 是 项 挑战 智力 的 任务 ， 而 且 我 们 只 有 
几 句 话 的 意见 可 提 。 如 果 大 家 研究 了 示例 2.4 和 示例 2.6 中 的 归纳 步骤 ， 就 会 注意 到 ， 每 种 情况 
下 ， 都 必须 对 试图 证 明 的 命题 S(n+1) 加 以 处 理 ,， 使 其 由 归纳 假设 S(n) 和 某 些 额外 内 容 组 成 。 
在 示例 2.4 中 ， 我 们 将 和 


1+2+4+"+2" +2"" 
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表示 为 归纳 假设 告诉 我 们 的 和 
1+2 二 4 十 … 十 2 

加 上 2 这 一 项 。 

在 示例 2.6 中 ， 我 们 用 两 个 长 度 为 1 的 位 串 集合 ( 称 为 Do 和 Di ) 表示 长 度 为 n+1 的 位 串 集合 
C， 这 样 一 来 ， 就 可 以 将 归纳 假设 应 用 到 这 些 集合 上 ， 并 推断 出 这 两 个 集合 都 是 大 小 有 限 的 。 

当然 ,对 命题 S(n+1) 加 以 处 理 ， 从 而 使 我 们 能 应 用 归纳 假设 ， 只 是 更 普遍 的 解 题 篇 言 “ 运 
用 给 定 条 件 ” 的 一 个 特例 。 当 必须 处 理 S(n+]) 的 “额外 ”部 分 ， 并 利用 Sl(n) 完成 对 Sln+]) 的 
证 明 时 ， 才 是 最 让 人 头疼 的 。 不 过 ， 以 下 规则 是 普遍 适用 的 。 


口 归 纳 证 明 必 须 在 某 个 地 方 表述 “……: 而 且 通 过 归纳 假设 我 们 可 知 …… ”如 果 没 有 的 话 ， 
就 不 算是 归纳 证 明 。 





2.3.3 习题 


(1) 通过 对 n 从 n= 1 起 进行 归纳 ， 证 明 以 下 公式 。 
(a) >》 i=n(n+l)/2 
(b) Di =n(n+D)(2n+1)/6 
() > i =n n+1) /4 
(d) /ili+D)=n/(n+]) 

(2) 形 如 4 =n(n+])/12 的 数字 称 为 三 角形 数 ， 因 为 将 弹 珠 排列 成 等 边 三 角形 ， 每 条 边 上 排 n 个 ， 那 么 
弹 珠 的 总 数 就 是 》"” i ， 而 从 我 们 在 习题 (1) 中 证 明 的 结论 可 知 这 是 个 弹 珠 。 例 如 ,保龄球 瓶 排 
列 成 每 条 边 上 有 4 个 球 瓶 的 等 边 三 角形 ， 共 有 t=4x5/2=10 个 保龄球 瓶 。 用 归纳 法 证 明 


n 


ty =n(n+ Dn +2)/6。 

(3) 判断 以 下 位 序列 的 奇偶 校 验 是 个 校 验 还 是 奇 校 验 。 
(a) 01101 
(b) 111000111 
(c) 010101 

(4) 假设 我 们 用 3 个 数字 ， 比 如 0、1 和 2， 来 为 符号 编码 。 由 0、1 和 2? 组 成 的 位 串 集合 C 中 ， 如 果 任 意 两 个 
位 串 不 只 有 一 个 位 置 不 同 ,那么 这 个 集合 就 是 检 错 的 。 例 如 ，{00，11，22} 就 是 长 度 为 2 的 位 串 的 检 
错 集合 。 证 明 对 任意 的 n 三 1, 使 用 数字 0、1 和 2 组 成 的 长 度 为 n 的 位 串 的 检 错 集合 最 多 只 有 3 站 个 位 串 。 

(5)* 证 明 : 对 任意 的 n 宇 1 ， 存 在 使 用 0、1 和 2 三 个 数字 组 成 的 长 度 为 x 的 位 串 的 检 错 集合 ， 其 中 含有 
3 个 位 串 。 

(6)* 证 明 : 如 果 使 用 k 个 符号 ， 对 任意 的 三 2 ， 都 有 使 用 k 个 不 同 符号 作为 “数字 ”并 且 长 度 为 n 的 
位 串 的 检 错 集合 ， 其 中 具有 六 "! 个 位 串 ， 但 这 样 的 位 串 集合 肯定 不 可 能 含有 超过 k”” 个 位 串 。 

(7) * 如 果 n 二 1， 则 使 用 0、1 和 2 这 三 个 数字 组 成 的 位 串 中 ， 连 续 位 置 完全 不 具 相 同 数字 的 位 串 共 有 
3 x2 下 个 。 例如， 长 度 为 3 的 此 类 位 串 共 有 : 010、012、020、021、101、102、120、121、201、 
202、210 和 212。 通 过 对 位 串 的 长 度 进行 归纳 来 证 明 该 结论 。 这 个 公式 对 n=0 来 说 是 否 为 真 ? 

(8)* 证 明 : 1.3 市 中 讨论 过 的 行 波 进位 加 法 算法 能 产生 正确 的 答案 。 提 示 : 通过 对 i 的 归纳 证 明 ， 考 虑 
从 右 端 起 的 位， 两 个 加 数 后 ;位 的 和 ， 其 二 进 制 形式 为 进位 位 后 跟 上 目前 为 止 所 生成 的 ;位 结 

(9)* 含 7 个 项 的 几何 级 数 oa ar oa ,ax 一 的 和 公式 是 
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通过 对 n 的 归纳 来 证 明 该 公式 。 请 注意 ， 要 让 公式 成 立 ， 必 须 假设 r 关 1。 在 证 明 过 程 中 会 在 哪里 
用 到 这 一 假设 呢 ? 
(10) 第 一 项 为 4， 公差 为 5 的 算术 级 数 a, (a+Db), (a+25),…, (at+(n--1)25) 的 求 和 公式 为 
ED) 
(a) 通过 对 n 的 归纳 证 明 该 公式 。 
(b) 证 明 习 题 (1) 中 的 (a) 也 是 该 公式 的 一 例 。 

(11) 给 出 两 段 非 正 式 的 证 明 ， 表 明 虽 然 命题 8(0) 为 假 ， 但 归纳 可 以 从 1 开始 “起 效 ”。 

(12) 通过 对 位 串 长 度 的 归纳 证 明 ， 由 奇 校 验 位 串 构成 的 代码 也 可 以 检 错 。 

(13) ** 如 果 某 种 编码 中 任意 两 个 位 串 不 同 的 位 置 不 少 于 3 位 , 那么 我 们 就 可 以 通过 找 出 该 编码 中 与 接 
收 到 的 位 串 仅 有 一 位 不 同 的 唯一 位 串 ， 纠 正 单 个 错误 。 事 实证 明 ， 有 一 种 针对 7 位 位 串 的 编码 ， 
它 可 以 纠正 单个 错误 并 含有 16 个 位 串 。 试 着 找 出 这 种 编码 。 提 示 : 推理 出 来 可 能 是 最 佳 方法 ,不 
过 如 果 推 理 失败 ， 可 以 写 程序 来 搜索 这 样 的 编码 。 

(14) * 偶 校 验 码 可 否 检 出 “双重 错误 ”， 也 就 是 两 个 不 同位 上 的 改变 ” 它 能 和 否 纠 正 单个 错误 ? 














算术 和 与 几何 和 


高 中 代数 中 的 两 个 公式 我 们 会 经 常用 到 。 它 们 都 有 着 有 趣 的 归纳 证 明 ， 也 就 是 我 们 在 习题 (9) 和 习题 
(10) 中 让 读者 证 明 的 。 
算术 级 数 ( 即 等 差 数列 ) 是 一 列 具 有 以 下 形式 的 n 个 数字 。 
a, (G+D), (a+2b), …, (a+(n—1)2) 
第 一 项 为 4， 而 每 一 项 都 要 上 比 前 一 项 大 bp。 这 nn 个 数字 的 和 ， 就 是 第 一 项 和 最 后 一 项 的 平均 数 的 n 倍 ， 
1 


Dat+bi=n(2a+(n-1)b)/2 


Er 
例如 ， 考 虑 一 下 3+5+7+9+11 的 和 。 总 共有 1 =S 项 ， 第 一 项 为 ?3， 最 后 一 项 为 11。 因 此 ， 这 个 和 
就 是 5x(3+1])/2=5x7=35 。 可 以 把 这 5 个 数 加 起 来 ， 来 证 明 这 个 和 是 正确 的 。 
几何 级 数 ( 即 等 比 数列 ) 是 一 列 具 有 如 下 形式 的 n 个 数字 。 
a, ar, ar”, Ga1 **, ar! 


也 就 是 说 ， 第 一 项 为 @， 而 每 一 项 都 是 前 一 项 的 r 倍 。7 项 几何 级 数 的 和 公式 是 


ar a 
气 (r-—D) 
在 这 里 ,ry 可 以 大 于 1， 也 可 以 小 于 1。 如 果 r =1 的 话 ， 以 上 公式 就 不 可 用 了 ， 不 过 所 有 项 都 是 4a， 其 
和 也 很 明显 ， 就 是 an。 
作为 几何 级 数 求 和 的 例子 ,考虑 一 下 1+2+4+8+16。 这 时 n=5 ， 第 一 项 4 就 是 1， 而 公 比 r=2 ， 因 此 
这 个 和 就 是 
(x2 -1)/(2-D)=(32-1)/1=31 
再 举 一 个 大 家 可 以 验证 的 例子 , 考虑 1+1/2+1/4+1/8+1/16 。 还 是 n=5 而 且 a=1, 不 过 +r =1/2， 
这 个 和 就 是 


Ly re 
0 DG 1)=(-31/32)/C-1/2) 1 
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简单 归纳 的 模板 

我 们 对 2.3 节 进行 总 结 ， 给 出 适用 于 该 节 中 归纳 证 明 过 程 的 简单 模板 。2.4 节 中 将 介绍 更 为 通用 的 模板 。 

(1) 指定 待 证 明 的 命题 S(n) 。 表 明 自 己 要 通过 对 hn 的 归纳 ， 对 所 有 nn 宇 i; ， 证 明 S(n)。 这 里 的 i0 是 作为 
归纳 依据 的 常数 ， 通 常 i0 是 0 或 1， 不 过 它 也 可 以 是 任意 整数 。 直 观 地 解释 n 的 含义 ， 比 如 ，n 是 码 字 的 长 度 。 

(2) 陈述 依据 情况 ， SC) 。 

(3) 证 明 依据 情况 ， 也 就 是 解释 S(i,) 为 何 为 真 。 

(4) 陈述 对 某 些 n 宇 ,假设 有 S(n), 也 就 是 陈述 “归纳 假设 ”, 建立 归纳 步骤。 用 1+ 1 替换 命题 S(n) 
中 的 n 来 表示 S(n+1)。 

(5) 假定 归纳 假设 S(n) 为 真 ,证明 S(n+1)。 

(6) 得 出 S(n) 对 所 有 nn 宇 ii 都 (但 对 更 小 的 n 不 一 定 ) 为 真 结 论 。 





2.4 ”完全 归纳 


目前 为 止 所 看 到 的 例子 , 在 证 明 S(n+1) 为 真 时 ,都 只 用 到 了 S(n) 作 为 归纳 假设 。 不过, 由 
于 要 对 参数 从 归纳 依据 开始 增加 的 值 证 明 命 题 $， 我 们 可 以 对 从 归纳 依据 到 nn 的 所 有 i 的 值 使 用 
S(i) ， 这 种 形式 的 归纳 叫 作 完全 归纳 (有 了 时 也 称 为 完美 归纳 或 强 归 纳 )。 而 2.3 市 所 示 的 简单 归 
纳 形 式 ， 也 就 是 只 用 S(n) 来 证明 S(n+1) ， 有 时 被 称 为 弱 归 纳 。 

先 来 考虑 一 下 如 何 进行 从 归纳 依据 n= 0 开始 的 完全 归纳 。 要 通过 以 下 两 个 步骤 来 证 明 
S(n) 对 所 有 nn 三 0 为 真 。 

(1) 先 证 明 归 纳 依 据 ，S(0) 。 

CO) 假设 S$(0), S(Q),…, S(n) 全 为 真 ， 作 为 归纳 假设 。 从 这 些 命题 来 证 明 S(n+1) 成立 。 

至 于 在 2.3 节 中 描述 的 弱 归纳 ， 也 可 以 在 选择 0 之 外 再 选择 某 个 值 a 作 为 归纳 依据 ,然后 证 明 
S(a) 归纳 依据 。 而 且 在 归纳 步 台 中 ， 可 以 只 假定 S(a), S(a+1),…S(n) 为 真 。 请 注意 ， 弱 归纳 
是 完全 归纳 的 一 个 特例 ， 应 用 弱 归 纳 ， 我 们 在 之 前 的 命题 中 只 选择 S(n) 来 证 明 S(n+1)。 

图 2-7 表 示 了 完全 归纳 的 原理 ,命题 S(n) 的 每 个 实例 在 其 证 明 过 程 中 都 可 以 使 用 下 标 比 其 小 
的 任意 实例 。 











图 2-7 完全 归纳 允许 每 个 实例 在 其 证 明 过 程 中 使 用 在 它 之 前 的 一 个 、 一 些 或 是 所 有 实例 


2.4.1 ”使 用 多 个 依据 情况 进行 归纳 

在 进行 完全 归纳 时 ， 拥 有 多 个 依据 情况 往往 是 很 实用 的 。 如 果 希 望 证 明 命题 S$(n) 对 所 有 
n 宇 吉 都 为 真 ,那么 不 仅 可 以 用 io 作 为 依据 情况 ,而 且 能 用 一 些 大 于 i 的 连续 整数 ( 假设 是 i ,i+1， 
i +2,…， 记 ) 作为 依据 情况 。 然 后 我 们 必须 完成 以 下 两 步 。 
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(1) 证 明 每 个 依据 情况 ， 即 命题 SG), SGi+1),…,S(j0)。 
(2) 假设 对 于 某 个 nn 三 jj， SGi),， S(t),…, Sln) 全 成 立 ， 作 为 归纳 假设 ， 并 证 明 Sn+1) 
为 真 。 


+ 示例 2.7 

第 一 个 完全 归纳 的 例子 是 使 用 多 个 依据 情况 的 简单 例子 。 正 如 我 们 将 要 看 到 的 ， 它 只 是 有 
限 程度 的 “完全 "。 为 了 证 明 Sn+1) ,我 们 没有 使 用 Stn) ， 而 只 使 用 了 SO -1D 。 在 更 普遍 的 完 
全 归纳 推理 中 ， 我们 要 使 用 S(n) 、Sw -1D 以 及 命题 8 的 很 多 其 他 实例 。 

下 面 通过 对 n 的 归纳 来 对 所 有 的 n 宇 0 证 明 以 下 命题 。™ 

命题 S(n) 。 总 是 存在 整数 qz 和 4b ( 正 整数 、 负 整数 或 0 ), 使 n= 2a+34b。 

依据 。 我 们 同时 采用 0 和 1 作为 依据 情况 。 

(1) 对 于 n=0， 可 以 选用 a=0 和 b=0。 显 然 0=2x0+3x0。 

(2) 对 于 n=1， 可 以 选用 a =--1 和 b=1。 然后 有 1=2x(-1)+3x1。 

归纳 。 现 在 ， 可 对 任意 的 n 三 0， 假设 Sln) 为 真 ， 并 证 明 S(n+1]) 为 真 。 请 注意 ， 可 假设 n 
至 少 是 从 我 们 已 证 明 的 依据 (这 里 nn 三 1 ) 起 的 连续 值 中 最 大 的 那个 。 而 命题 Stn+1) 就 是 说 存 
在 某 些 整数 zc 和 2， 使 得 2+1=2a+32 。 

归纳 假设 表明 S(0), SQ) …, Sln) 全 部 为 真 。 请 注意 ， 序 列 从 0 开始 是 因为 它 是 连续 依据 情 
况 的 下 限 。 因 为 可 以 假设 n 宇 1,， 我 们 知道 ma-1 关 1， 因此 So -1 为 真 。 该 命题 就 是 说 ， 存 在 整 
数 a 和 pb， 使 得 n+1= 2a+3b。 

由 于 命题 Sn+1]) 中 需要 用 到 a， 因 此 这 里 重新 声明 S(n -1 使 用 不 同名 称 的 整数 ， 比 方 说 存 
在 整数 a' 和 4b'， 使 得 








n—l=2a’+3b' (2.6) 
如 果 给 (2.6) 的 两 边 都 加 上 2， 就 得 到 n+1=1(a'+1)+35' 。 如 果 接 着 令 a=a'’+1，4b=b'， 那 

么 就 存在 整数 vc 和 0 ， 使 得 命题 n+1= 24 + 3 为 真 。 该 命题 就 是 So +1D) ， 所 以 我 们 已 经 证 明了 该 

归纳 推理 。 请 注意 ， 在 证 明 过 程 中 ,没有 用 到 S(n) ， 但 用 到 了 Smw -1 。 

2.4.2 ”验证 完全 归纳 


就 像 2.3 节 中 讨论 的 普通 归纳 (或 “ 弱 ” 归 纳 ) 那样 ,通过 “最 少 反例 ” 论 证 ， 完 全 归纳 也 


可 以 被 直观 地 证 实 为 一 种 证 明 技巧 。 令 依据 情况 为 Sm) ，S+l) ，…，Swm) ， 并 假设 已 经 证 
明了 对 任意 的 n 宇 扣 ，S(io) ，S(i+1) ，…，Sln) 能 一 起 推出 Sn+1)。 现 在 ,假设 至 少 存在 一 


个 不 小 于 io 的 n 值 使 Sn) 不 成 立 ， 并 设 b 是 令 S(D) 为 假 的 最 小 的 不 小 于 io 的 整数 。 那 么 bp 就 不 能 是 i 
和 j0 之 间 的 整数 , 否则 与 归纳 依据 矛盾 ,此 外 ,5 也 不 能 大 于 jo 不然 , SGi) ,SCi+1) ,…,S(bp 一 1) 
全 为 真 。 而 归纳 步骤 接着 就 会 告诉 我 们 S(D) 也 为 真 ， 这 样 就 产生 了 矛盾 。 

2.4.3 ”算术 表达 式 的 规范 形式 


现在 探讨 将 算术 表达 式 变 形 为 等 价 形式 的 例子 。 它 表明 完全 归纳 利用 了 可 假设 竺 证 明 的 命 
题 $ 对 所 有 nn 以 下 ( 包含 n ) 的 参数 都 为 真 这 一 事实 。 





J 其 实 ， 这 个 命题 对 所 有 的 n, 不 论 n 是 正 整 数 还 是 负 整 数 ， 都 是 成 立 的 , 不 过 n 为 负 整 数 的 情况 需要 男 外 进行 归纳 
推理 ， 我 们 将 这 个 证 明 过 程 留 给 大 家 作为 习题 。 
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作为 一 种 激励 形式 ， 编 程 语 言 的 编译 需 可 以 利用 算术 运算 符 的 代数 形式 ， 重 新 排列 所 计算 
的 算术 表达 式 中 操作 数 的 顺序 。 这 种 重 排 的 目标 是 为 计算 机 找 出 一 种 比 表 达 式 原 有 计算 顺序 耗 
时 更 少 的 方式 来 计算 该 表达 式 。 

在 本 节 中 ,只 考虑 含有 一 种 结合 和 交换 运算 符 〈 比如 + ) 的 算术 表达 式 ， 并 看 看 可 以 对 操作 
数 进行 怎样 的 重新 排列 。 我 们 将 证 明 ， 如 果 有 任意 只 含 “+” 运 算 符 的 表达 式 ， 那么 该 表达 式 的 
值 ， 要 与 其 他 任何 只 对 同样 操作 数 使 用 “+” 的 表达 式 的 值 相 等 ,不管 以 何 种 顺序 排列 及 (或 ) 
以 何 种 形式 组 合 。 例 如 


(aa +(a +W))+(a +as)=a, +(a, +(a; 二 (as +as))) 


我 们 将 进行 两 段 单独 的 归纳 推理 ， 以 证 明 这 一 说 法 ， 其 中 第 一 段 归 纳 推理 是 完全 归纳 。 





结合 性 和 交换 性 
回想 一 下 加 法 结合 律 ， 就 是 说 在 求 三 个 数 的 和 时 ， 既 可 以 将 前 两 个 数 相 加 ， 然 后 加 上 第 三 
个 数 得 到 结果 ， 也 可 以 用 第 一 个 数 ， 加 上 第 二 个 数 与 第 三 个 数 相 加 的 结果 ， 两 种 情况 下 结果 是 
相同 的 。 形 如 : 
(EF +E,)+E,=E+(E,+E,) 
其 中 ，E1、 包 和 3 都 是 算术 表达 式 。 例 如 ， 
(+2)+3=1+(2+3) 
这 里 有 El=1]、Ey=2， 以 及 B=3。 还 比如 
(7) +3z2-2))+y+2)=x+((32—-2)+(y+2)) 
这 里 有 El=xy，Es=3z-2， 以 及 =y+z。 
接着 回想 一 下 加 法 交换 律 ， 就 是 说 可 以 将 两 个 表达 式 按照 任意 顺序 相 加 。 形 如 : 
Et+E,=E,+E 
例如 ，1+2=2+1 ,以 及 xy+(3z 一 2)=(3z-2)+xy。 





+ 示例 2.8 

我 们 要 对 n( 表达 式 中 操作 数 的 数目 ) 进行 完全 归纳 ， 以 证 明 命题 S(n) 成 立 。 

命题 S(n) 。 如 果 E 是 含有 “+” 运 算 符 和 n 个 操作 数 的 表达 式 ， 而 a 是 其 中 一 个 操作 数 ， 那 么 
可 以 通过 使 用 结合 律 和 交换 律 ， 将 E 变形 成 a+F 的 形式 ， 其 中 表达 式 F 含 有 E 中 除 q 之 外 的 所 有 
操作 数 ， 而 且 这 些 操 作 数 是 使 用 “+” 运 算 符 以 某 种 顺序 组 合 在 一 起 的 。 

命题 S(n) 只 对 n 宇 2 成立， 因为 表达 式 E 中 至 少 要 出 现 一 次 “+” 运 算 符 。 因 此 ， 我们 要 使 
用 n=2 作 为 归纳 依据 。 

依据 ,。 令 n=2。 那么 E 只 可 能 是 a+b 或 p+a，, 如 果 说 a 之 外 的 那个 操作 数 是 5 的话 ,。 在 a+b 
中 , 今 为 表达 式 b, 那么 命题 就 成 立 了 ,而 在 b+a 的 情况 下 , 注意 到 通过 使 用 加 法 交换 律 , bp+a 
可 以 变形 为 a+b ， 因 此 我 们 就 可 以 再 次 令 已 =D 。 

归纳 。 设 E 有 n+1 个 操作 数 ， 并 假设 SQ) 对 i = 2,3,…,n 都 为 真 。 我 们 需要 为 n 三 2 证 明 该 归 
纳 步 又 , 所 以 可 假设 A 最 少 有 3 个 操作 数 , 也 就 是 至 少 出 现 两 次 “+” 运 算 符 。 可 以 将 E 号 为 EB +,， 
其 中 和 是 某 些 表 达 式 。 因 为 E 中 正好 有 n+1 个 操作 数 , 而 且 瓦 和 已 都 一 定 至 少 含 有 这 些 操作 
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数 中 的 一 个 ， 这 样 一 来 E. 和 ,中 的 操作 数 都 不 能 超过 n 个 。 因 此 ， 归 纳 假设 适用 于 El 和 E,， 只 要 
它们 都 不 止 有 一 个 操作 数 ( 因为 我 们 开始 时 将 n=2 作 为 依据 )。 有 4 种 情况 必须 考虑 : 4 是 在 已 
中 还 是 在 轧 中 ， 以 及 a 是 否 为 BE 或 中 唯一 的 操作 数 。 

(a) El 就 是 a 本 里 。 当 E 为 a+ (b+c) 时 ,就 是 这 种 情况 。 这 里 就 是 4， 而 妃 就 是 b+c 。 在 这 
种 情况 下 ，E, 就 是 F， 也 就 是 说 ，E 本 身 就 已 经 是 a+F 的 形式 。 

(b) Bl 含有 多 个 操作 数 ，a 是 其 中 一 个 。 比 如 

E=(c+t+(d+a))+(b+e) 

其 中 =c+(4d+a)，E,=bt+e。 这 里 ， 因 为 8 的 操作 数 不 超 过 nn 个 ,但 至 少 达 到 了 两 个 ， 
所 以 可 以 应 用 归纳 假设 ,使 用 交换 律 和 结合 律 ， 将 互 变 形 为 a+E,。 因 此 ，E 可 以 变形 为 
(a+E,)+E,。 对 该 式 应 用 结合 律 ， 就 能 将 E 进 一 步 变 形 为 a+ (E+E,)。 这 样 , 我 们 就 可 以 选择 
了 为 ,+ ,这 就 证 明了 这 种 情况 下 的 归纳 步骤 。 对 本 例 中 的 妃 , 也 可 以 假设 将 =c+(d+a) 变 
形 为 ac+(c+a) 。 那 么 E 就 可 以 重新 分 组 为 a+((c+d)+(b+e))。 

(0) 就 是 a。 例如，EE=b+(a+c)。 这 种 情况 下 ， 可 以 用 交换 律 将 EB 变形 为 a+ EE ， 如 果 令 
了 F 为 E!， 这 就 是 我 们 想 要 的 形式 。 

(d) 含有 包括 a 在 内 的 多 个 操作 数 。 比 方 说 ,，E = b+(a+c)， 这 时 可 以 用 交换 律 将 E 变 形 
成 E+E ， 这 样 就 成 了 情况 (b)。 如 果 = b+(a+tc)， 可 将 E 先 变形 为 (a+c)+b。 通 过 归纳 假 
设 , ac+c 可 以 转换 成 所 需 的 形式 ,事实 上 ,结果 已 经 出 来 了 ,然后 结合 律 就 将 EZ 变 形 为 a+ (c+b)。 

在 这 4 种 情况 中 ， 都 是 将 有 变形 为 所 需 的 形式 。 因 此 ， 归 纳 步 又 得 到 了 证 明 ， 可 以 得 出 S(n) 
对 所 有 的 n 宇 2 都 为 真 的 结论 。 
+ 示例 2.9 

示例 2.8 中 的 归纳 证 明 直 接 引 出 了 一 种 将 表达 式 转换 成 所 需 形 式 的 算法 。 考虑 如 下 表达 式 作 
为 例子 : 





E=(x+(z+v))+(w+y) 

假设 v 是 我 们 希望 “ 拉 出 来 ”的 那个 操作 数 ， 也 就 是 扮演 示例 2.8 的 变形 中 a 的 那个 角色 。 一 开始 ， 
我 们 介绍 一 个 符合 情况 (b) 的 例子 ， 其 中 =x+(z+v)， 而 =wt+y。 

接着 ， 必 须 对 表达 式 E1 进 行 处 理 ， 从 而 将 wv“ 拉 出 来 ”"。E 符 合 情 况 (d)， 因 此 我 们 先 用 交换 
律 将 其 变形 为 (z+v)+x。 作 为 情况 (b) 的 实例 ， 必 须 对 表达 式 z+v 情况 (c) 的 实例 ) 加 以 处 理 ， 
此 要 通过 交换 律 将 其 变形 为 vt+z 。 

现在 Ei 被 变形 为 (wv+z)+x ， 接 着 使 用 结合 律 将 其 变形 成 v+(z+x), 也 就 是 将 BE 变形 成 了 
(V+(z+Xx))+(w+y) 。 通 过 结合 律 ， 可 把 E 变 形 为 (wv+(z+x))+(w+y) 。 因 此 ，E=v+， 其 中 
F 就 是 表达 式 (z+x)+(w+y)。 图 2-8 总 结 了 整个 变形 过 程 。 














图 2-8 ”使 用 交换 律 和 结合 律 ， 可 以 将 任意 操作 数 ( 比如 v )“ 拉 出 来 ” 
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现在 ， 可 以 使 用 示例 2.8 中 证 明 过 的 命题 来 证 明 我 们 的 原始 论点 ， 也 就 是 说 任意 两 个 只 涉及 
+ 运算 符 与 同一 些 不 同 操作 数 的 表达 式 ， 都 可 以 通过 结合 律 和 交换 律 相互 变形 。 这 里 是 用 2.3 方 
中 讨论 的 弱 归纳 证 明 的 ,没有 使 用 完全 归纳 。 


+ 示例 2.10 

让 我 们 通过 对 表达 式 中 操作 数 的 个 数 n 的 归纳 证 明 以 下 命题 。 

命题 7(n) 。 如 果 E 和 FF 是 只 售 + 运 算 符 以 及 同一 组 n 个 不 同 操 作 数 的 表达 式 , 那么 可 以 通过 多 
次 应 用 结合 律 和 交换 律 将 变形 为 F。 

依据 。 如 果 n=1， 那 么 两 个 表达 式 肯 定 都 只 有 一 个 操作 数 a。 因 为 E 和 Fr 是 相同 的 表达 式 ， 所 
以 E 确 实 “ 可 变形 为 ”F。 

归纳 。 假设 T(n) 对 某 些 n 宇 1 为 真 , 现在 要 证 明 7T(n+1) 为 真 。 设 E 和 FF 是 具有 同一 组 n+1 个 
操作 数 的 表达 式 ， 由 于 n+1 宇 2 ， 那 么 示例 2.8 中 的 命题 Sn+]) 必然 成 立 。 因 此 ， 我 们 可 将 E 变 
形 为 a+ EE ， 其 中 El 是 含有 E 中 其 他 n 个 操作 数 的 表达 式 。 类 似 地 ， 可 以 将 F 变 形 为 a+ 五 ， 其 中 
下 与 Bl 含 有 相同 的 n 个 操作 数 。 更 重要 的 是 ， 在 这 种 情况 下 ， 我 们 还 可 以 进行 逆 回 的 变形 , 使 用 
结合 律 和 交换 律 将 a+ 变形 为 F。 

现在 可 以 对 志和 下 援引 归纳 假设 T(n) 。 这 两 个 表达 式 具 有 相同 的 n 个 操作 数 ， 因 此 归纳 假 
设 可 以 应 用 。 这 就 是 说 我 们 可 将 El 变形 为 Fi， 所 以 可 将 a+ 变形 为 a+ 五 。 因 此 我 们 可 以 通过 
如 下 变形 





E 一 … 一 at+ 刀 ”使 用 Sln) 
a+ 使 用 Tl 
ee 逆 回 使 用 So +D) 


将 E 变 形 为 F。 


+ 示例 2.11 
让 我 们 将 = (x+y)+(w+z) 变形 为 =((w+z)+y)+x。 先 选择 一 个 要 “ 拉 出 来 ”的 操作 
数 ， 比 如 说 是 w。 如 果 审 视 示 例 2.8 中 的 情况 ， 就 会 发 现 我 们 对 E 进 行 了 一 系列 变形 


(x+y)+w+tz) w+z)+(x+y) w+ (z+(x+y)) (2.7) 
而 对 进行 了 如 下 变形 
(w+z)+y)+xX (w+t(z+y))+x > w+((z+y)+x) (2.8) 


现在 有 了 将 z+(x+y) 变形 为 (z+y)+x 的 子 问题 。 我 们 要 通过 将 x“ 拉 出 来 ”来 解决 这 一 问 
题 ， 需 要 进行 的 变形 是 
z+(xX+y) (xX+y)+z x+(y+2) (2.9) 
和 
(Zz+y)+X—> XxX+(z+y) (2.10) 
这 又 带 来 了 将 y+z 变形 为 z+y 的 子 问题 ， 只 要 应 用 交换 律 便 可 解决 该 问题 。 严 格 地 说 ， 
我 们 使 用 了 示例 2.8 的 技术 ,“ 拉 出 ”了 每 个 表达 式 中 的 y, 为 每 个 表达 式 留 下 y+z 。 然 后 示例 2.10 
中 的 依据 情况 告诉 我 们 ， 表 达 式 z 可 以 “变形 为 ” 它 本 身 。 
通过 行 (2.9) 中 的 步骤 , 可 以 将 z+(x+y) 变形 为 (z+y)+x ,接着 对 子 表 达 式 y+z 应 用 交换 
律 ， 最 后 再 反 轴 使 用 行 2.10) 中 的 变形 。 我 们 把 这 些 变形 当 作 将 (x+y)+(w+z) 变形 为 
((w+z)+y)+x 的 中 间 过 程 。 首 先 要 应 用 行 (2.7) 中 的 变形 ， 接 着 用 刚 讨论 的 变形 将 z+(x+y) 变 





40 第 2 章 ， 和 迭代 、 娄 纳 和 递归 





形 为 (z+J)+x ， 最 后 青 反 向 使 用 行 (2.8) 中 的 变形 。 整 个 变形 过 程 可 概括 为 图 2-9 所 示 的 情况 。 





(x »y) (w 2) 表达 式 E 

(w+2z)+(x+y) (2.7) 的 中 间 形 式 

w+(z+(x+y)) (2.7) 的 最 终 形式 

w+((x+y)+2) (2.9) 的 中 间 形 式 

w+(x+(y+2)) (2.9) 的 最 终 形式 

w+(x+(z+y)) 交换 律 

w+((z+y)+x) 反 向 使 用 (2.10) 

(w+(z+y))+x 有 反 向 使 用 (2.8) 的 中 间 形 式 
((w+2z)+y)+x 表达 式 ， 反 向 使 用 (2.8) 的 最 终 形式 








图 2-9 ”使 用 交换 律 和 结合 律 将 一 个 表达 式 变 形 为 为 一 个 表达 式 





2.4.4 习题 





所 有 归纳 推理 的 模板 


以 下 形式 的 归纳 证 明 , 涵盖 了 具有 多 个 依据 情况 的 完全 归纳 。 它 还 将 2.3 节 中 介绍 的 弱 归 纳 作 为 一 种 
特例 包含 其 中 ， 并 包含 了 只 有 一 个 依据 情况 的 一 般 情况 。 

(1) 指定 要 证 明 的 命题 S(n) 。 声 明 要 通过 对 hn 的 归纳 , 证明 S(n) 对 hn 之 i 为 真 。 指 定 i 的 值 ， 通常 是 
0 或 1， 但 也 可 以 是 其 他 整数 。 直 观 地 解释 1 表示 什么 。 

(2) 陈述 依据 情况 (一 个 或 多 个 )。 这 些 将 是 从 记 起 到 某 个 整数 ji 的 所 有 整数 。 通常 万 =m， 不 过 六 
也 可 以 是 其 他 整数 。 

(3) 证 明 各 个 依据 情况 SO) ,SG+D ,，…，SO) 。 

(4) 声明 假设 S(i0) ,SGo+D ,…，S(n) 为 真 ( 就 是 “归纳 假设 ”) ， 并 要 证 明 S(n+1) ， 以 此 来 建立 归 
纳 步 又 。 声 明 自 己 在 假设 过 jh ， 也 就 是 n 至 少 要 跟 最 大 的 依据 情况 一 样 大 。 通 过 用 n+1 替换 S(n) 中 的 n 
来 表示 SU +D) 。 

(5) 在 (4) 中 提 到 的 假设 下 证 明 S(n+1)。 如 果 归 纳 为 弱 归 纳 而 不 是 完全 归纳 ， 那 么 证 明 中 只 需要 用 到 
S(n) ， 不 过 用 归纳 假设 中 的 任 一 或 全 部 命题 都 是 可 以 的 。 

(6) 得 出 S(n) 对 所 有 的 n 宇 i (但 不 一 定 对 更 小 的 n ) 都 为 真 。 





(1) 从 表达 式 =(u+yv)+((w+(x+y))+z) 中 依次 “ 拉 出 ”每 个 操作 数 。 也 就 是 说 ， 从 E 的 每 个 部 分 
开始 ， 并 使 用 示例 2.8 中 的 技巧 将 E 变 形 为 u+ 这 样 的 表达 式 。 接 着 再 将 B 变形 为 v+ ,这 样 的 
表达 式 ， 以 此 类 推 。 

(2) 使 用 示例 2.10 中 的 技巧 完成 以 下 变形 。 

(a) 将 w+(x+(y+z)) 变形 为 ((w+x)+y)+z。 
(b) 将 (wt+w)+((x+y)+2z) 变形 为 ((y+w)+(v+2z))+x 

G) * 设 E 是 含 +、-、* 和 /这 几 种 运算 符 的 表达 式 ， 其 中 每 种 运算 符 都 是 二 元 的 ， 也 就 是 说 ， 这 些 运 
算 符 部 接受 两 个 操作 数 。 对 运算 符 在 BZ 中 出 现 的 次 数 进行 完全 归纳 , 证 明 如 有 果 E 中 出 现 n 个 运算 符 ， 
那么 E 具 有 n+1 个 操作 数 。 
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(4) 给 出 一 个 具有 交换 性 但 不 具 结合 性 的 二 元 运算 符 。 

(5) 给 出 一 个 具有 结合 性 但 不 具 交 换 性 的 二 元 运算 符 。 

(6) * 考虑 运算 符 全 为 二 元 运算 符 的 表达 式 E。E 的 长 度 是 指 E 中 符号 的 数目 ， 将 一 个 运算 符 或 左边 括 
号 或 右边 括号 记 作 一 个 符号 ， 并 将 任 一 操作 数 ( 比如 123 或 abc ) 记 作 一 个 符号 。 证 明 E 的 长 度 肯 
定 为 奇数 。 提 示 : 通过 对 表达 式 E 的 长 度 进行 完全 归纳 来 证 明 该 声明 。 

0) 证 明 : 每 个 负 整 数 都 可 以 写成 2a+32 的 形式 ， 其 中 a 和 4b 部 是 整数 (不 一 定 是 正 整 数 ) 。 

(8)* 证 明 : 每 个 整数 ( 正 整 数 或 负 整 数 ) 都 可 以 写 为 Sa+72 的 形式 ， 其 中 a 和 4b 都 是 整数 (不 一 定 是 
正 整 数 ) 。 

(9)* 弱 归 纳 证 明 ( 如 2.3 方 中 那些 ) 是 否 也 是 完全 归纳 证 明 ? 完全 归纳 证 明 是 否 也 是 弱 归纳 证 明 ? 

(10)* 在 本 方 中 我 们 展示 了 如 何 通 过 最 少 反 例 论证 来 验证 完全 归纳 。 这 表明 了 完全 归纳 也 可 通过 迭代 
来 验证 。 



































真相 大 揭露 


在 证 明 程 序 正确 的 过 程 中 ， 存 在 很 多 理论 上 和 实践 上 的 困难 。 一 个 很 明显 的 问题 是 : “程序 ‘正确 
表示 什么 意思 ? ”正如 我 们 在 第 1 章 中 提 到 过 的 ， 多 数 在 练习 中 编写 的 程序 只 满足 某 些 非 正 式 的 规范 ,这 
些 规范 本 身 可 能 是 不 完整 或 不 一 致 的 。 即 便 是 存在 确切 的 正式 规范 ， 我 们 也 可 以 证 明 ， 并 不 存在 可 以 证 
明 任 意 的 程序 等 同 于 给 定 规范 的 某 个 算法 。 

尽管 存在 这 些 困难 ， 但 陈述 并 证 明 与 程序 有 关 的 断言 还 是 有 好 处 的 。 程 序 的 循环 不 变 式 〈loop 
invariant ) 通常 是 人 们 可 以 给 出 的 最 实用 的 程序 工作 原理 的 简短 解释 。 此 外 ， 程 序 员 在 编写 一 段 代码 时 ， 
应 该 将 循环 不 变 式 谨 记 心头 。 也 就 是 说 ， 程 序 能 正常 工作 一 定 是 存在 某 些 原因 的 ， 而 这 个 原因 通常 必须 
与 程序 每 次 进行 循环 或 每 次 执行 递归 调用 时 都 成 立 的 归纳 假设 相关 。 程序 员 应 该 能 设想 出 一 个 证 明 过 程 ， 
即使 行 逐 行 把 证 明 过 程 写 下 来 可 能 并 不 现实 。 





2.5 证 明 程 序 的 属性 


在 本 市 中 ,我们 将 深入 到 这 样 一 个 领域 : 证 明 程 序 能 完成 它 声称 能 做 的 工作 。 在 这 个 领域 
中 ， 归 纳 证 明 起 着 举足轻重 的 作用 。 我 们 将 看 到 一 项 技术 ， 它 可 以 解释 迭代 程序 在 进行 循环 的 
过 程 中 在 做 些 什么 。 如 果 理 解 循环 在 做 什么 ， 基 本 上 就 能 明白 需要 对 迭代 程序 有 哪些 了 解 。 在 
2.9 方 中 ， 我 们 会 介绍 证 明 递归 程序 的 属性 需要 些 什么 。 


2.5.1 循环 不 变 式 


要 证 明 程 序 中 循环 的 属性 , 关键 是 要 选择 循环 不 变 式 〈 或 称 归 纳 断 言 ) 也 就 是 每 次 进入 循 
环 中 某 个 特定 点 时 都 为 真 的 命题 $。 然后 通过 对 以 某 种 方式 衡量 循环 次 数 的 参数 进行 归纳 , 证 明 
该 命题 S。 例 如 ， 该 参数 可 以 是 我 们 到 达 某 whi le 循环 测试 的 次 数 ， 也 可 以 是 for 循 环 中 循环 下 
标的 值 ， 还 可 以 是 某 个 涉及 每 次 循环 时 都 递增 1 的 程序 变量 的 表达 式 。 


+ 示例 2.12 
举 个 例子 ， 我 们 考虑 一 下 2.2 节 中 SelectionSort 的 内 层 循环 。 以 下 这 儿 行 代码 带 着 与 图 
2-2 中 相同 的 编号 : 
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(2) small = i; 

(3) for (j = i+i; j < n; j++) 
(4) if (A[j] < A[small]) 
(5) small = j; 








回想 一 下 ， 这 几 行 代码 的 目的 是 使 smal11 等 于 ATi. .n-1] 中 值 最 小 的 元 素 的 下 标 。 要 证 实 该 声明 
为 何 为 真 , 考虑 一 下 如 图 2-10 所 示 的 该 循环 的 流程 图 。 该 流程 图 展示 了 执行 该 程序 必需 的 5 个 步骤 。 











图 2-10 ”selectionSort 内 层 循环 的 流程 图 


(1) 首先 ， 需 要 将 smal11 初 始 化 为 ?， 如 同 在 第 (2) 行 中 所 做 的 那样 。 

(2) 在 第 (3) 行 的 for 循 环 开始 的 时 候 ， 要 将 j 初 始 化 为 1+1。 

(3) 接着 ,需要 测试 是 否 有 j <n。 

(4) 如 果 是 ， 就 执行 有 第 (4) 行 和 第 (5) 行 组 成 的 循环 体 。 

(5) 在 循环 体 结束 的 位 置 ， 需 要 递增 j ， 并 返回 测试 的 位 置 。 

在 图 2-10 中 看 到 ， 在 测试 之 前 有 一 点 被 标记 为 循环 不 变 式 命题 S(X) ， 我 们 很 快 就 会 发 现 这 
是 个 什么 样 的 命题 。 第 一 次 到 达 该 测试 时 ，j 的 值 为 ?+1， 而 smal1 的 值 为 7。 第 二 次 到 达 该 测 
试 时 , j 的 值 是 ?+ 2 , 因为 j 已 经 递增 了 一 次 。 因 为 循环 体 ( 第 4 行 和 第 $ 两 行 ) 会 在 402+H 比 4 
小 的 条 件 下 将 sma11 置 为 ?+1, 所 以 我 们 看 到 small 总 是 4 如 和 4[i+1] 中 较 小 的 那个 的 下 标 。” 














(QD 为 防止 出 现 持 平 的 情况 ，small 应 该 是 i。 不 过 一 般 情 况 下 我 们 会 假设 不 会 出 现 持平 的 情况 ， 并 将 “最 小 元 素 第 
一 次 出 现 ” 说 成 “最 小 的 元 素 ”。 
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类 似 地 ， 当 第 三 次 到 达 测 试 时 ，j 的 值 是 i+3 ， 而 smal1 则 是 Ari. .i+2] 中 最 小 那个 的 下 
标 。 因 此 我 们 将 试 着 证 明 看 似 一 般 规则 的 如 下 命题 。 

命题 S(k) 。 在 k 为 循环 下 标 j 的 值 的 情况 下 ， 如 果 到 达 第 (3) 行 的 for 声 明 中 对 j <n 的 测试 ， 
那么 smal1l 的 值 就 是 A[i. .k-1] 中 最 小 元 素 的 下 标 。 

请 注意 ， 我 们 在 这 里 使 用 字母 : 隶 表 示 变 量 j 在 循环 进行 时 可 能 具有 的 值 。 这 不 像 用 j 来 表 
示 了 JJ 的 值 那样 烦琐 ， 因 为 有 时 候 需要 保持 k 林 变 ， 而 同时 j 的 值 又 在 变化 。 还 要 注意 ，$S(b) 的 表 
述 中 有 “如 果 到 达 ……”, 这 是 因为 某 些 /的 值 比 循环 下 标 j 的 值 更 小 而 使 循环 中 断 , 所 以 可 能 根 
本 没 法 到 达 循 环 测试 。 如 果 k 是 这 些 值 之 一 ， 那 么 S(K) 一 定 为 真 ， 因 为 任何 “车 4 则 B” 形 式 的 
命题 在 4 为 假 时 都 为 真 。 

依据 。 依 据 情 况 是 上 =i+l ， 其 中 为 第 (3) 行 中 变量 i 的 值 。" 在 循环 开始 时 ， 有 j=i+1。 也 
就 是 说 ,我 们 刚 执行 完 第 (2) 行 , 把 丘 值 给 sma1l1, 并 且 将 j 初 始 化 为 i+1 ,以 开始 该 循环 。S(i+1) 
表示 ，small 是 A [i. .i] 中 最 小 元 素 的 下 标 ， 也 就 是 说 sma11 的 值 一 定 是 i。 从 技术 上 讲 , 我 们 
还 必须 证 明 , 除了 第 一 次 到 达 测 试 时 之 外 ，j 的 值 从 不 可 能 是 i+1。 从 直观 上 说 ,其 原因 就 是 每 
次 进行 循环 时 ，j 都 会 递增 ， 所 以 它 再 也 不 会 有 i+1 这 么 小 了 。( 为 了 精益 求 精 ， 我 们 应 该 在 除 
了 第 一 次 通过 测试 外 都 有 j >i+1 的 假设 下 进行 归纳 证 明 。 ) 因此 , 归纳 依据 S(i+1) 被 证 明 为 真 。 

归纳 。 现 在 假定 我 们 的 归纳 假设 S(k) 对 某 些 k 三 i+1 成 立 ， 并 证 明 S(k+]) 为 真 。 首先 ， 如 
果 k 宇 n， 那么 在 j 的 值 为 £, 或 更 早 之 前 , 循环 就 中 断 了 ， 所 以 肯定 不 会 在 j 的 值 等 于 k+1 时 到 
达 该 循环 测试 。 在 这 种 情况 下 ，S(k+1) 一 定 为 真 。 

因此 ， 我 们 假设 x<n ， 如 此 一 来 ， 实 际 上 已 经 进行 了 j 等 于 k+1 时 的 测试 。S(K) 说 的 是 
smal1l 表 示 A[i. .k-1] 中 最 小 元 素 的 下 标 ， 而 SK+ID 则 是 说 small 表 示 A[i. .k] 中 最 小 元 素 
的 下 标 。 如 果 考 虑 当 j 的 值 为 时 循环 体 (第 4 行 和 第 5 行 ) 中 会 发 生 的 事情 ， 就 会 出 现 如 下 两 种 
情况 ， 具 体 取决 于 第 (4) 行 的 测试 是 否 为 真 。 

(1) 如 果 A[K] 不 小 于 A[i. .k-1] 中 的 最 小 值 ， 那 么 smal11 的 值 不 会 改变 。 不 过 ， 在 这 种 情 
况 下 ，smal11 还 要 表示 AIi. .k] 中 最 小 元 素 的 下 标 ， 因 为 4 如 不 是 最 小 的 。 因 此 , 在 这 种 情况 
下 S(k+1) 表述 的 结论 为 真 。 

(2) 如 果 4[ 引 小 于 4 加 到 4- 这 些 值 的 最 小 值 ， 那 么 就 要 将 smal11 置 为 K SCK+D 表述 
的 结论 还 是 成 立 ， 因 为 k 是 A[i. .k] 中 最 小 元 素 的 下 标 。 

因此 ， 不 管 哪 种 情况 ，smal11 都 是 Ari. .k] 中 最 小 元 素 的 下 标 。 我 们 通过 递增 变量 j 来 进 
行 for 循 环 。 因 此 ， 在 循环 测试 之 前 ， 当 j 的 值 为 +1 时 ，SK+D 表 述 的 结论 成 立 。 现 在 就 证 
明了 由 5S(o 可 以 得 到 S(k+1)。 我 们 已 经 完成 了 归纳 , 并 得 到 S(k) 对 所 有 大 大 1+1 的 值 都 为 真 这 
样 的 结论 。 

接 下 来 ， 应 用 S(K) 来 声明 第 (3) 行 到 第 (5) 行 的 内 层 循 环 。 当 j 的 值 达到 n 时 ， 程序 会 退出 循 
环 。 因为 S(n) 表示 small 是 A[i..n-1] 中 最 小 元 素 的 下 标 , 所 以 可 以 得 出 一 个 有 关内 层 循环 工 
作 方 式 的 重要 结论 。 我 们 会 在 下 一 个 示例 中 看 看 如 何 利 用 这 个 结论 。 


+ 示例 2.13 
现在 ， 考 虑 整个 SelectionSort 函 数 ， 我 们 在 图 2-11 中 重 现 了 其 核心 部 分 。 表 示 这 段 代 
码 的 流程 图 如 图 2-12 所 示 ， 其 中 “循环 体 ” 是 指 图 2-11 中 的 第 (2) 到 (89) 这 几 行 。 归 纳 断 言 7Cz) 还 




































































QD 就 行 (3) 到 行 (5) 的 循环 而 言 ，i 是 不 会 改变 的 。 因 此 计 1 是 可 用 作 根 据 值 的 合适 常数 。 
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是 关于 在 循环 终止 的 测试 开始 前 什么 一 定 为 真 的 命题 。 通 俗 地 说 ,就 是 当 i 的 值 为 m 时 ,我们 选 
中 较 小 的 m 个 元 素 , 并 将 它们 排序 在 数组 开头 的 位 置 。 更 具体 地 讲 就 是 , 我们 要 通过 对 m 的 归纳 
证 明 以 下 命题 7(m) 为 真 。 





(1) for (i = 0; i < n-i; i++) { 

(2) small = i; 

(3) for (j = i+l; j < n; j++) 
(4) if (A[j] < A[small]) 

(5) small = j; 

(6) temp = A[smalll]; 

(7) A[lsmall] = A[i]; 

(8) A[i] = temp; 





图 2-11 Selectionsort 国 数 的 主体 











循环 体 第 (2) 行 
至 第 (8) 行 





图 2-12 ”整个 选择 排序 函数 的 流程 图 


命题 Tlm) 。 如 果 到 达 第 (1) 行 中 i<n--1 的 循环 测试 时 变量 i 的 值 等 于 m， 那 么 有 : 

(a) A[0..m-1] 是 有 序 排列 的 ， 也 就 是 说 ，4[0] 二 Al1] 专 … 4[m-1]。 

(b) A[m. .n-1] 的 所 有 元 素 不 小 于 A[0..m-1] 中 任 一 元 素 。 

依据 。 依 据 情况 是 m=0。 依 据 为 真 的 原因 微不足道 。 如 果 考 虑 命题 7(0) ， 那 么 (a) 部 分 就 
是 说 A[0..-1] 是 已 排序 的 。 不 过 在 4[0] 、…、A[-]] 的 范围 内 没有 元 素 ， 所 以 (a) 一 定 为 真 。 类 
似 地 ，7(0) 的 (b) 部 分 是 说 , A[0. .n-11 的 所 有 元 素 都 至 少 与 AT[0. . -1] 中 任 一 元 素 一 样 大 。 由 
于 后 者 描述 的 范围 内 没有 元 素 ， 所 以 (b) 部 分 也 为 真 。 

归纳 。 在 归纳 步骤 中 ,假设 7T(m) 对 所 有 的 m 宇 0 都 为 真 ， 并 要 证 明 T(m+]) 成 立 。 就 像 在 
示例 2.12 中 那样 ,我 们 又 要 试 着 证 明 形 如 “车 4 则 B” 的 命题 ,而 只 要 4 为 假 , 那么 这 样 的 命题 肯 
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定 为 真 。 因 此 ， 如 果 “ 到 达 for 循 环 测试 时 i 等 于 m+1” 这 一 假设 为 假 ， 那 么 T(m+1) 就 为 真 。 
因而 可 以 假设 我 们 确实 在 i 的 值 为 m+1 时 到 达 了 该 测试 ， 也 就 是 说 ， 可 以 假设 m <n-l1。 

当 i 的 值 为 m 时 ， 循环 体会 找 出 A[m. .n-1] 中 的 最 小 元 素 ( 如 示例 2.12 中 命题 S(m) 所 证 明 
的 )。 在 第 (6) 行 至 第 (8) 行 中 ， 该 元 素 会 与 4[m] 互 换 。 归 纳 假设 T(m) 的 (b) 部 分 告诉 我 们 ， 被 选 
中 的 这 个 元 素 不 小 于 A[0. .m-1] 中 任 一 元 素 。 此 外 ,那些 元 素 还 是 已 排序 的 ,所 以 现在 A[i..m] 
中 所 有 元 素 也 是 已 排序 的 。 这 也 就 证 明了 命题 7(m+1) 的 (a) 部 分 。 

要 证 明 7T(m+1) 的 (b) 部 分 ， 我们 看 到 所 选择 的 4[m] 不 大 于 A[m+1..n-1] 中 的 任 一 元 素 。 
T(m) 的 (a) 部 分 告诉 我 们 , A[0. .m-1] 已 经 不 大 于 A[m+1..n-1] 中 任 一 元 素 了 。 因 此 , 在 执行 
函数 的 第 (2) 行 到 第 (8) 行 并 递增 i 后 ， 可 知 A[m+1. .n-1] 中 所 有 元 素 都 不 小 于 A[0..m] 中 任 一 
元 素 。 由 于 现在 i 的 值 为 m+1， 我们 证 明了 命题 7(m+1) 的 真实 性 ， 所 以 就 证 明了 该 归纳 步 又。 

现在 , 邻 m=n-1。 我们 知道 ， 当 i 的 值 为 -1 时 ,会 退出 外 层 循环 ， 所 以 7T(n -TD 将 会 在 
完成 这 次 循环 后 成 立 。7T(n 一 1) 的 (a) 部 分 表示 ，AT[0..n-2] 中 所 有 元 素 都 是 已 排序 的 ， 而 其 (b) 
部 分 则 是 说 4[n 一 1] 不 小 于 其 他 任何 元 素 。 因 此 ， 在 该 程序 终止 后 ， 和 中 的 元 素 是 以 非 递 减 顺序 
排列 的 ， 也 就 是 说 ， 它 们 是 已 排序 的 。 


2.5.2 while 循环 的 循环 不 变 式 
在 讲 到 形 如 


while (<condition>) 
<body> 


的 while 循 环 时 ， 通 常 都 可 以 为 循环 条 件 测试 前 的 那 一 点 找 出 合适 的 循环 不 变 式 。 一 般 来 说 ， 
我 们 会 试 着 通过 对 循环 次 数 的 归纳 来 证 明 循 环 不 变 式 成 立 。 然 后 ， 当 条 件 为 假 时 ， 可 以 利用 循 
环 不 变 式 以 及 条 件 为 假 的 事实 ， 得 出 一 些 关 于 while 循 环 终止 后 什么 为 真 的 有 用 信息 。 

不 过 ， 与 for 循 环 不 同 的 是 ， 可 能 不 存在 为 while 循 环 计数 的 变量 。 更 糟 的 是 ， 尽 管 for 循 
环 可 以 保证 最 多 只 会 迭代 到 循环 的 限制 ( 例如 , SelectionSort 程 序 的 内 层 循环 最 多 循环 n -1 
次 )， 我 们 却 没 理 由 相信 while 循 环 的 条 件 可 能 会 变 为 假 。 因 此 ， 证 明 whi1le 循 环 正确 性 的 部 分 
工作 就 是 要 证 明 while 循 环 最 终 会 终止 。 一 般 要 通过 涉及 程序 中 变量 的 某 个 表达 式 E， 按照 如 下 
方式 一 起 来 证 明 循环 的 终止 。 

(1) 每 进行 一 次 循环 ，E 的 值 至 少 会 减少 1。 

(2) 如 果 E 的 值 小 到 某 个 指定 的 常数 ( 比如 0 )， 循 环 条 件 就 为 假 。 
+ 示例 2.14 


阶乘 也 数 ， 写 作 n!， 表 示 的 是 整数 1x2x…xn 的 积 。 例 如 , 1!=1, 2!=1x2=2, 5!=1x2 
x3x4x5=120。 图 2-13 所 示 的 简单 程序 片段 就 是 用 来 计算 n 三 1 时 的 n! 的 。 















































(1) scanf ("%d'", &n); 

(2) i = 2; 

(3) fact = 1; 

(4) While (i <= n) 1 

(5) fact = fact*i; 
(6) i+t+; 

(7) printf("%d\n", fact); 





图 2-13 ”阶乘 程序 片段 
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首先 , 要 证 明 图 2-13 中 第 (4) 行 至 第 (6) 行 的 while 循 环 一 定 会 终止 。 这 里 我 们 选择 的 表达 式 E 
是 n-i。 请 注意 , 每 进行 一 次 while 循 环 , i 的 值 在 第 (6) 行 会 增加 1, 而 n 的 值 则 保持 不 变 。 因此， 
每 进行 一 次 循环 ，E 的 值 就 会 减少 1。 此 外 ， 当 E 的 值 为 -1 或 更 小 时 ， 有 nn-i 志 -1 ， 或 者 说 是 
i 三 n+1。 因 此 ， 当 E 变 为 负 值 时 , 循环 条 件 i 三 n 就 不 再 成 立 , 循环 就 将 终止 。 一 开始 并 不 知道 
有 有 多 大 ， 因 为 不 知道 要 读 入 的 n 值 为 多 少 。 不 过 ,不 管 该 值 为 多 少 ，Z 最 终 都 能 小 到 -1 ， 而 循 
环 将 会 终止 。 

现在 必须 证 明 图 2-13 中 的 程序 能 够 完成 它 应 该 做 的 工作 。 合 适 的 循环 不 变 式 命题 如 下 ， 我 
们 要 通过 对 变量 i 的 值 的 归纳 来 证 明 该 命题 。 

命题 S(7) 。 如 果 在 到 达 循 环 测试 i 三 n 时 变量 i 的 值 为 ;， 那 么 变量 fact 的 值 就 是 (j 一 1D)!。 

依据 。 归 纳 依据 是 S$(2) 。 只 有 当 从 外 部 进入 该 循环 时 ， 在 到 达 该 测试 时 i 的 值 才 为 2。 在 循 
环 开 始 前 , 图 2-13 中 的 第 (2) 行 和 第 (3) 行 会 将 fact 的 值 置 为 1, 并 将 :的 值 置 为 2。 由 于 1= (2-D1， 
所 以 归纳 依据 得 到 证 明 。 

归纳 ,假设 5S()) 为 真 ,并 证 明 S(j+1) 为 真 ,如 果 j7>n, 那么 当 i 的 值 为 或 更 早 之 时 , 该 while 
循环 就 中 断 了 , 因此 当 i 的 值 为 j+1 时 , 我 们 根本 无 法 到 达 该 循环 测试 , 在 这 种 情况 下 ,，S(j+1) 
为 平 几 真 ( trivially true )， 因 为 它 具 有 “如 果 我 们 到 达 ……” 这 种 形式 。 

因此 , 假设 三 n ,并 考虑 一 下 在 i 的 值 为 时 ， 执行 while 循 环 的 循环 体会 发 生 什 么 。 通 过 
归纳 假设 , 在 第 (5) 行 被 执行 之 前 ，fact 的 值 为 (7 一 ])! ,而 i 的 值 为 j。 因 此 ,在 第 (5) 行 执行 完 之 
后 ，fact 的 值 为 jx(j 一 ])!， 也 就 是 j1。 

在 第 (6) 行 , i 增加 了 1, 其 值 就 达到 了 j+1。 因此 , 当 i 带 着 值 j+1 到 达 该 循环 测试 时 , fact 
的 值 是 媳 。 命 题 S(j+]) 就 是 说 ， 当 i 等 于 j+1 时 ，fact 等 于 ((j+1)-1)!, 也 就 是 1。 因 此 , 我 
们 证 明了 命题 S(j+1) ， 并 完成 了 归纳 步骤 。 

之 前 已 经 证 明了 while 循 环 将 终止 。 由 此 可 见 ， 它 将 在 i 第 一 次 具有 大 于 n 的 值 时 终止。 
为 i 是 整数 ， 而 且 每 进行 一 次 循环 就 会 增加 1， 所 以 i 在 循环 终止 时 的 值 一 定 是 n+1。 因 此 ， 当 
到 达 第 (7) 行 时 ,命题 S(n+1) 一 定 成 立 。 不 过 该 命题 表示 fact 的 值 为 nt。 因 此 ， 程 序 会 打印 出 
n!， 正 如 我 们 想 要 证 明 的 。 

作为 一 个 实际 问题 ， 应 该 指出 ， 图 2-13 中 的 阶乘 程序 在 任何 计算 机 上 都 只 能 打印 出 少量 几 
个 n 的 阶乘 值 na! 作为 答案 。 因 为 阶乘 函数 增长 得 特别 快 , 答案 的 大 小 很 快 就 超过 了 现实 中 任何 一 
台 计 算 机 上 整数 的 最 大 大 小 。 


2.5.3 习题 


(1) 以 下 程序 片段 会 让 sum 的 值 等 于 从 1 到 n 的 整数 之 和 ， 为 其 找 出 合适 的 循环 不 变 式 。 
scanf ("hd" ,&n); 
sum = 0; 
for (i = 1; i <= n; i++) 
sum = sum + i; 
通过 对 i 的 归纳 证 明 找 出 的 循环 不 变 式 成 立 ， 并 利用 它 证 明 程序 可 按照 预期 工作 。 
(2) 以 下 程序 片段 可 计算 数组 A[0. .n-1] 中 各 整数 之 和 : 












































sum = 0; 
for (i = 0; i < n; i++) 
sum = sum + A[i]; 


为 其 找 出 合适 的 循环 不 变 式 ， 利 用 该 循环 不 变 式 证 明 程 序 可 按照 预期 工作 。 





(3)* 考虑 如 下 片段 : 


scanf ("%d", &n):; 

X= 2; 

for (i = 1; i <= n; i++) 
X=X* xX; 


对 应 i 过 的 测试 之 前 那 点 的 合适 循环 不 变 式 会 满足 如 下 条 件 : 如 果 我 们 到 达 该 点 时 变量 i 的 
值 为 ,那么 有 x=2* 。 通 过 对 K 的 归纳 ,证明 该 不 变 式 成 立 。 在 循环 终止 后 ，x 的 值 是 多 少 ? 
(4) * 图 2-14 中 的 程序 片段 会 持续 读 入 整数 ， 直 到 读 到 负 整 数 为 止 ， 然 后 会 打印 出 这 些 整数 的 和 。 为 
循环 测试 之 前 的 那 点 找 出 合适 的 循环 不 变 式 ， 利 用 该 不 变 式 证 明 该 程序 片段 可 按照 预期 工作 。 





sum = 0; 

scanf ("Wd", &x); 

while (x >= 0) { 
sum = Sum + XX; 
scanf ("hd", &x); 





图 2-14 “为 一 列 整数 求 和 ， 通 过 负 整 数 来 终止 循环 


(5) 考虑 图 2-13 所 示 程 序 中 的 x， 找 出 自己 的 计算 机 能 处 理 的 n 的 最 大 值 。 定 长 整数 对 证 明 程序 的 正确 
有 什么 影响 ? 
(6) 通过 对 图 2-10 中 程序 循环 的 次 数 进 行 归 纳 ， 证 明 在 第 一 次 循环 后 j >i+1 。 


2.6 ”人 束 归 定义 


在 递归 定义 〈 或 归纳 定义 ) 中 ,我 们 用 一 类 或 多 类 紧密 相关 的 对 象 或 事实 本 身 来 对 它们 进 
行 定 义 。 这 种 定义 一 定 不 能 是 无 意义 的 ， 比 如 “ 某 个 部 件 是 某 个 有 某 种 颜色 的 部 件 ”， 也 不 能 是 
似是而非 的 ， 比 如 “ 当 且 仅 当 某 事 物 不 是 glotz 时 它 才 是 glotz” 。 归 纳 定 义 涉 及 : 

(1) 一 条 或 多 条 依据 规则 ， 在 这 些 规则 中 ， ee 象 ; 

(2) 一 条 或 多 条 归纳 规则 ， 利 用 这 些 规则 ， 通 过 集合 中 较 小 的 对 象 来 定义 较 大 的 对 象 。 


+ 示例 2.15 
在 2.5 节 中 我 们 通过 迭代 算法 定义 了 阶乘 函数 : 将 1x2x…xn 相 乘 得 到 n!。 其 实 ， 还 可 以 按 
照 以 下 方式 递归 地 定义 n! 的 值 。 
依据 。1!= 1。 
归纳 。n! =nx(n-1)!。 
例如 ， 依 据 告诉 我 们 1! = 1。 这 样 就 可 以 在 归纳 步骤 中 使 用 该 事实 ， 得 到 = 2 时 
2!=2xl!=2xl=2 

















对 n =3、4 和 5， 有 
31=3x2!=3x2=6 
4 二 4x3= 二 4x6=24 
51=5x4!=5x24=120 
等 等 。 请 注意 ， 虽 然 术语 “阶乘 ”看 起 来 就 是 用 目 身 来 定义 的 ， 但 在 实践 中 ， 可 以 只 通过 值 较 
小 的 n 的 阶乘 ， 得 到 值 逐 步 增 大 的 n 对 应 的 n! 的 值 。 因 此 ， 我们 具备 了 有 意义 的 “阶乘 ” 
严格 地 讲 ， 应 该 证 明 ，n! 的 递归 定义 可 以 得 出 与 原来 的 定义 相同 的 结果 ， 
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nl=]1x2x*…xn 


要 证 明 这 一 点 ， 就 要 证 明 如 下 命题 。 
命题 S(n) 。 按 照 上 述 方式 递归 地 定义 的 n!， 等 于 1x2x…xn 
通过 对 n 的 归纳 来 完成 证 明 。 
依据 。S(Q) 显然 成 立 。 递 归 定 义 的 依据 告诉 我 们 1! = 1， 而 且 1x…x1l( 即 “从 1 到 1” 这 些 
整数 的 积 ) 的 积 显 然 也 等 于 1。 
归纳 。 假 设 S(n) 成 立 ， 也 就 是 说 ， 由 递归 定义 给 出 的 n! 等 于 1x2x…xn。 而 递归 定义 告诉 
我 们 
(n+1)!= (n+1)xn! 
如 果 应 用 乘法 交换 律 ， 就 有 
(nt+D)!=nx(n+D) (2.11) 
由 归纳 假设 可 知 


n!l=1x2x*…xn 
因此 ， 可 以 用 1x2x…xn 替换 等 式 (2.11) 中 的 nt!， 就 可 以 得 到 


(n+l)!l=1x2x*…xnx(n+l) 
这 也 就 是 命题 Stn+1) 。 这 样 就 证 明了 归纳 假设 ,并 证 明了 对 n! 的 递归 定义 与 迭代 定义 是 相同 的 。 
图 2-15 显 示 了 递归 定义 的 一 般 本 质 。 它 在 结构 上 与 完全 归纳 类 似 , 都 含有 无 限 的 实例 序列 ， 
个 实例 都 依赖 于 之 前 的 任 一 或 所 有 实例 。 我 们 通过 应 用 一 个 或 多 个 依据 规则 开始 。 接 下 来 的 
_ 共 昌 纳 要 对 已 经 得 到 的 内 容 应 用 一 条 或 多 条 归纳 规则 ， 从 而 建立 新 的 事实 或 对 象 。 再 接 下 
来 的 一 轮 归 纳 ， 再 次 对 已 经 掌握 的 内 容 应 用 归纳 规则 ， 获 得 新 的 事实 或 对 象 ， 以 此 类 推 。 
































递归 步骤 的 
第 n 次 使 用 


递归 步骤 的 
第 2 次 使 用 


递归 步骤 的 
第 1 次 使 用 






依据 情况 


图 2-15 在 归纳 定义 中 ， 要 一 轮 一 轮 地 建立 对 象 ， 在 某 一 轮 建 立 的 对 象 可 能 会 依赖 于 
之 前 所 有 轮 次 建立 的 对 象 


在 定义 阶乘 的 示例 2.15 中 ,我 们 从 依据 情况 得 到 了 1! 的 值 , 应 用 一 次 归纳 步骤 得 到 2!, 应 用 
两 次 归纳 步骤 得 到 3!， 等 等 。 这 里 的 归纳 具有 “普通 ”归纳 的 形式 ， 在 每 一 轮 的 归纳 中 ， 都 只 
用 到 在 前 一 轮 归 纳 中 得 到 的 内 容 。 


+ 示例 2.16 

在 2.2 节 中 ,定义 了 词典 顺序 的 概念 ， 当 时 的 定义 是 具有 迭代 性 质 的 。 粗 略 地 讲 ， 通 过 从 左 
起 比较 对 应 符号 c 和 di， 测试 字符 串 c…c 是 否 先 于 字符 串 4…4q, ， 直 到 找到 某 个 值 i 令 cd, ， 
或 者 到 达 其 中 一 个 字符 串 的 结尾 。 以 下 的 递归 定义 定义 了 字符 串 对 w 和 lx， 其 中 w 在 词典 顺序 上 





要 先 于 x。 从 直观 上 讲 ， 要 对 两 个 字符 串 从 开头 起 相同 字符 对 的 数目 进行 归纳 。 
依据 。 该 依据 涵盖 了 那些 我 们 能 立即 分 出 字符 顺序 先后 的 字符 串 对 。 依 据 包含 如 下 两 个 部 分 。 
(1) 对 任何 不 为 e 的 字符 串 w， 都 有 e<w。 回 想 一 仆 ，e 表示 空 字符 串 ， 也 就 是 不 含 字符 的 字 





符 串 。 
(2) 如 果 c < 4 ， 其 中 c 和 d 都 是 字符 ， 那 么 对 任何 字符 串 w 和 x， 都 有 cw< 必 。 
归纳 。 如 果 字 符 串 w 和 x 具 有 w<x 的 关系 ,那么 对 任意 字符 c， 都 有 cw< cx 。 
例如 ,可 以 使 用 以 上 定义 表明 lbase < batter。 根据 依据 的 规则 (2), 有 c=s, d=t, w=e， 
X=tter， 因 此 有 se<tter。 如 果 应 用 递归 规则 一 次 ， 有 c=a,，w=e， 以 及 x=tter。 最 后 ， 
第 二 次 应 用 递归 规则 ， 有 c=b,，w=ase, 以 及 x=atter。 也 就 是 说 , 依据 和 归纳 步骤 是 如 下 这 
样 的 : 

se < tter 


ase < atter 
base < batter 


还 可 以 按照 以 下 方式 证 明 lbat < tter。 依 据 的 部 分 (1) 告 诉 我 们 ，e < ter。 如 果 应 用 递归 规 
则 3 次 ， 其 中 c 依 次 等 于 、a 和 b， 就 可 以 进行 如 下 推理 : 


€ < ter 

t < tter 
at < atter 
bat < batter 








现在 应 该 对 两 个 字符 串 从 左 端 起 相同 的 字符 数 进行 归纳 ， 证 明 当 且 仅 当 字 符 串 按照 刚 给 出 
的 递归 定义 排 在 前 面 之 时 ， 才 能 按照 2.2 节 中 的 定义 得 出 它 也 排 在 前 面 的 结论 。 我 们 还 留 了 两 个 
归纳 证 明 的 习题 。 

在 示例 2.16 中 ， 如 图 2-15 所 示 的 事实 组 是 很 大 的 。 依 据 情 况 给 出 了 所 有 w<x 的 事实 ,不 管 
是 w=e, 还 是 w 和 x 以 不 同 字符 开头 。 使 用 归纳 步 又 一 次 , 就 给 出 当 w 和 x 只 有 第 一 个 字母 相同 时 ， 
所 有 w<x 的 情况 ; 第 二 次 使 用 ， 就 给 出 了 那些 当 w 和 x 只 有 前 两 个 字母 相同 时 的 所 有 情况 ， 以 
此 类 推 。 
2.6.1 ”表达 式 

各 种 算术 表达 式 是 递归 定义 的 ， 我 们 为 这 种 定义 的 依据 指定 了 原子 操作 数 可 以 是 什么 。 例 
如 ， 在 C 语 言 中 ， 原 子 操作 数 既 可 以 是 变量 ， 也 可 以 是 常量 。 然 后 ， 归 纳 过 程 告诉 我 们 可 应 用 
哪些 运算 符 ， 以 及 每 个 运算 符 可 以 应 用 到 多 少 个 操作 数 上 。 例 如 ， 在 C 语 言 中 ,运算 符 < 可 以 
应 用 到 两 个 操作 数 上 , 运算 符 符号 -可 以 应 用 于 一 至 两 个 操作 数 , 而 由 一 对 圆 括号 加 上 括号 内 必 
要 数量 的 逗号 表示 的 函数 应 用 运算 符 ， 则 可 以 应 用 于 一 个 或 多 个 操作 数 ， 比 如 f(a,…, a,)。 


+ 示例 2.17 
通常 将 如 下 的 表达 式 称 作 “ 算 术 表 达 式 ”。 
依据 。 以 下 类 型 的 原子 操作 数 是 算术 表达 式 : 
(1) 变量 ; 
(2) 整数 ; 
(3) 实数 。 
归纳 。 如 果 E1 和 ,是 算术 表达 式 ， 那 么 以 下 表达 式 也 是 算术 表达 式 : 
(1) (EitE,) 
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(2) (Ei-E,) 

(3) (EixE,) 

(4) (EE,) 

运算 符 +、 一 、x 和 /都 是 二 元 运算 符 ， 因 为 它们 都 接受 两 个 参数 。 它 们 也 叫 作 中 组 ( 插入 ) 
运算 符 ( infix operator )， 因 为 它们 出 现在 两 个 参数 之 间 。 

此 外 ,我 们 允许 减 号 在 表示 减法 之 外 ,还 可 以 表示 否定 (符号 改变 )。 这 种 可 能 性 反映 在 了 
第 5 条 ， 也 是 最 后 一 条 递归 规则 中 : 

(5) 如 果 有 是 算术 表达 式 ， 那 么 (-E) 也 是 。 

像 规则 (5) 中 的 -这 样 只 接受 一 个 操作 数 的 运算 符 ， 称 为 一 元 运算 符 。 它 也 称 为 前 组 运算 符 ， 
为 它 出 现在 参数 之 前 。 

图 2-16 展 示 了 一 些 算术 表达 式 ， 并 解释 了 为 什么 它们 都 是 表达 式 。 请 注意 ， 有 时 候 括 号 是 
不 必要 的 ， 可 以 忽略 。 比 如 图 2-16 中 最 后 的 表达 式 (vi) ， 外 层 括号 和 表达 式 -(x+10) 两 侧 的 括 
号 都 是 可 以 忽略 的 ， 而 我 们 可 以 将 其 写 为 y-(x+10) 。 然 而 ， 剩 下 的 括号 是 必 不 可 少 的 ， 因 为 

















yx-x+10 按照 约定 会 被 解释 为 (yx--x)+10 ， 这 就 不 是 与 yx-(x+10) 等 价 的 表达 式 了 ( 例如， 
试 试 y=1 和 x=1 )。” 

(i) x 依据 规则 (1) 

(ii) 10 依据 规则 (2) 

(iii) (x+10) 对 (人 和 ( 妆 应 用 递 上 规则 (]) 

(iv) (—(x+10)) 对 Gi 应 用 递归 规则 (3) 

(V) y 依据 规则 (1) 

Ci (yx(-(x+10))) 对 (Vv) 和 (iv) 应 用 递归 规则 (5) 





图 2-16 一 些 算术 表达 式 示例 





更 多 运算 符 术语 
出 现在 其 参数 之 后 的 一 元 运算 符 ， 比 如 表达 式 n! 中 的 阶乘 运算 符 !， 称 为 后 级 运算 符 。 如 
果 接 受 多 个 操作 数 的 运算 符 重复 地 出 现在 其 所 有 参数 之 前 或 之 后 , 那么 它们 也 可 以 是 前 组 或 后 
级 运算 符 。 在 C 语 言 或 普通 算术 中 没有 这 类 运算 符 的 例子 ,不 过 我 们 在 5.4 节 中 将 要 讨论 一 些 所 
有 运算 符 都 是 前 级 或 后 级 运算 符 的 表示 法 。 
接受 3 个 参数 的 运算 符 就 是 三 元 运算 符 。 举 例 来 说 ， 在 C 语 言 中 ， 表 示 “ 若 c 则 XxX， 否则 y” 
的 表达 式 c?x:y 中 ， 运 算 符 ? :就 是 三 元 运算 符 。 如 果 运算 符 接受 [个 参数 ， 就 称 其 是 [元 的 。 





2.6.2 平衡 圆 括号 


可 以 出 现在 表达 式 中 的 圆 括号 串 称 为 平衡 国 括 号 。 例 如 ， 在 图 2-16 的 表达 式 (vi 中 出 现 的 
((0)) 模 式 ， 以 及 如 下 表达 式 





J 如 果 运 算 符 约定 俗 成 的 优先 级 〈 一 元 的 减 号 优先 级 最 高 ， 接 着 是 乘 号 和 除 号 ， 再 接着 是 加 号 和 减 号 )， 以 及 “ 左 
结合 性 ”的 传统 约定 ( 即 优先 级 相同 的 运算 符 一 一 比如 一 串 加 号 和 减 号 一 一 从 左边 开始 结合 ) 已 经 暗示 了 括号 
的 存在 ， 那 么 括号 就 是 多 余 的 。 不 管 是 C 语 言 还 是 普通 的 算术 ， 都 遵守 这 些 约 定 。 








((a +Db)x ((c+ d) -e)) 

具有 的 (0(0)) 模 式 。 空 字符 串 e 也 是 平衡 圆 括 号 串 ， 例 如 ， 它 的 模式 是 表达 式 x。 一 般 来 说 ， 判 
定 圆 括号 串 乎 衡 的 条 件 是 , 每 个 左 圆 括号 都 能 与 其 右 侧 的 某 个 右 圆 括号 配对 。 因 此 , “平衡 圆 括 
号 串 ” 的 一 般 定义 由 以 下 两 个 规则 组 成 : 

(1) 平衡 圆 括号 串 中 左 圆 括号 和 右 圆 括号 的 数量 相等 ; 

(2) 在 沿 着 括号 串 从 左 向 右 行进 的 过 程 中 ， 该 串 的 量变 从 不 为 负 值 ， 其 中 量变 ( profile ) 是 
对 行进 过 程 中 已 达到 左 括号 数目 减 去 已 到 达 右 括号 数目 的 累计 值 。 
请 注意 ， 统 计 值 必 须 从 0 开始 ， 以 0 结束 。 例 如 ， 图 2-17a 表 示 的 是 (0(0)) 的 量变 ， 而 图 2-17b 表 
示 的 是 0(0)0 的 量变 。 

















( (CC) ( () ) ) 
(a) (0(0) 的 量变 


) ( ) 
(b) 0(0)0 的 量变 


图 2-17 ”两 个 括号 串 的 量变 





“平衡 圆 括 号 ”的 概念 有 着 多 种 递归 定义 。 下 面 的 定义 比较 巧妙 ,不 过 我 们 将 证 明 , 该 定义 
相当 于 之 前 提 到 的 涉及 统计 值 的 非 递 归 定 义 。 

依据 。 空 字符 串 是 平衡 圆 括号 串 。 

归纳 。 如 果 x 和 ?是 平衡 圆 括号 串 ， 那 么 007 也 是 平衡 圆 括号 串 。 


+ 示例 2.18 

由 依据 可 知 ，e 是 平衡 圆 括 号 串 。 如 果 应 用 递归 规则 ,其 中 x 和 y 都 等 于 e， 就 可 以 得 出 0 是 平 
衡 的 。 请 注意 ， 在 将 空 字符 串 提交 给 变量 ( 如 x 或 y ) 时 ， 该 变量 就 “消失 ”了 。 然 后 可 以 按 以 
下 方法 应 用 递归 规则 。 

(1)x=0 且 y=e， 得 出 (0) 是 平衡 的 。 

(2)x=e 晶 y= 0 得 出 00 是 平衡 的 。 

(3)x=y=()， 得 出 (0)0 是 平衡 的 。 

最 后 ， 因 为 已 知 (0) 和 00 是 平衡 的 ， 所 以 可 以 令 递 归 规 则 中 的 x 和 y 为 这 两 者 ， 就 证 明了 
((0))00 是 平衡 的 。 

可 以 证 明 两 种 “平衡 ”定义 指定 的 是 同一 组 括号 串 。 为 了 让 表述 更 清楚 ， 我 们 将 根据 递归 
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定义 定义 的 平衡 括号 串 直 接 称 为 平衡 括号 串 ， 而 将 根据 非 递 归 定 义 定 义 的 平衡 括号 串 称 为 量变 
平衡 括号 串 。 量 变 平衡 括号 串 就 是 那些 量变 最 终 为 0 而 且 从 不 为 负 值 的 括号 串 。 需 要 证 明 以 下 
两 点 。 

(1) 每 个 平衡 括号 串 都 是 量变 平衡 的 。 

(2) 每 个 量变 平衡 括号 串 都 是 平衡 的 。 

这 就 是 下 面 两 个 示例 中 归纳 证 明 的 目标 。 








+ 示例 2.19 

首先 ， 我 们 来 证 明 (1) 部 分 ， 也 就 是 每 个 平衡 括号 串 都 是 量变 平衡 的 。 这 上 段 证 明 复 制 了 7 定义 
平衡 括号 串 所 使 用 的 完全 归纳 。 也 就 是 说 ， 我 们 要 证 明 如 下 命题 。 

命题 S(n) 。 如 果 括 号 串 w 是 通过 n 次 应 用 递归 规则 被 定义 为 平衡 的 ，w 就 是 量变 平衡 的 。 

依据 。 依 据 为 n= 0。 不 需要 通过 应 用 任何 递归 规则 便 可 证 明 其 平衡 的 括号 串 就 是 e， 它 的 
平衡 是 由 依据 规则 得 出 的 。 由 此 可 见 ， 空 字符 串 的 量变 最 终 为 0， 而 且 从 不 为 负 值 ， 所 以 e 是 量 
变 平衡 的 。 

归纳 。 假 设 SQ) 对 i=0,1,…,n 为 真 ， 并 考虑 Sn+1) 的 实例 ， 也 就 是 说 证 明 w 为 平衡 括号 
串 需要 n+1 次 使 用 递归 规则 。 考虑 最 后 那 次 递归 规则 的 使 用 , 就 是 拿 两 个 已 知 为 平衡 的 括号 串 x 
和 y， 组 成 形 为 (x)y 的 w。 我 们 使 用 了 n+1 次 递归 规则 来 形成 w， 而 且 最 后 一 次 利用 递归 规则 既 
不 是 用 来 形成 x-， 也 不 是 用 来 形成 y。 因 此 ， 形 成 x 和 y 都 不 需要 利用 递归 规则 n 次 以 上 。 所 以 ,， 归 
纳 假设 可 以 应 用 于 x 和 y， 而 且 可 以 得 出 x 和 y 都 是 量变 平衡 的 。 

w 的 量变 如 图 2-18 所 示 。 它 首先 会 上 升 一 级 ， 作 为 对 第 一 个 左 圆 括号 的 回应 。 接 着 是 x 的 量 
变 , 由 虚线 所 示 , w 的 量变 在 这 里 会 再 上 升 一 级 。 我 们 使 用 归纳 假设 得 出 x 是 量变 平衡 的 , 因此 ， 
它 的 量变 始 于 第 0 级 日 终于 第 0 级 ， 而 且 从 不 为 负 。 如 图 2-18 所 示 ， 由 于 w 的 量变 中 x 的 部 分 已 经 
上 升 了 一 级 ,该 部 分 从 第 1 级 开始 ， 在 第 1 级 结束 ， 而 且 从 来 不 低 于 第 1 级 。 























图 2-18 ”构造 w= (x)y 的 量变 


显 式 出 现在 zx 和 ?之 间 的 右 圆 括号 将 w 的 量变 降 为 0。 接 着 就 到 了 ?的 量变 。 根 据 归 纳 假设 ,，》 





是 量变 平衡 的 ， 因 此 在 w 的 量变 中 ，y 的 部 分 不 会 低 于 0， 而 且 它 让 w 的 量变 最 终归 于 0。 

我 们 现在 已 经 构造 了 w 的 量变 ,并 发 现 它 满足 量变 平衡 括号 串 的 条 件 。 也 就 是 说 ，w 的 量变 
从 0 开始 ， 以 0 结束 ， 并 且 从 不 为 负 值 。 这 样 就 证 明了 ， 如 果 括 号 串 是 平衡 的 ， 那 么 它 就 是 量变 
平衡 的 。 

现在 介绍 “平衡 圆 括号 ”两 种 定义 等 价 性 的 第 二 个 方向 。 在 示例 2.20 中 ， 将 要 证 明 量变 平 
衡 的 括号 串 是 平衡 的 。 




















对 递归 定义 的 证 明 


请 注意 ， 在 示例 2.19 中 ， 通 过 对 递归 规则 ( 用 来 证 实 某 对 象 在 定义 的 类 中 ) 的 使 用 次 数 进 
行 归 纳 ， 证 明了 与 一 类 递归 定义 的 对 象 (平衡 圆 括 号 串 ) 有 关 的 断言 。 这 是 处 理 递 归 定 义 概 念 
的 一 种 常见 方法 ， 其 实 也 是 递归 定义 很 实用 的 原因 之 一 。 在 示例 2.1$ 中 ， 通 过 对 1 的 归纳 ， 证 
明了 递归 定义 的 阶乘 值 的 属性 ( 即 n! 就 是 1 到 n 这 nn 个 整数 的 积 ) 而 在 对 1 的 定义 中 ,使 用 了 7-1 
次 递归 规则 ， 所 以 该 证 明 过 程 也 可 视 作 对 递归 规则 应 用 次 数 进 行 归 纳 。 





+ 示例 2.20 

现在 来 证 明 (2) 部 分 ， 通 过 对 圆 括号 串 的 长 度 进行 完全 归纳 ， 由 “量变 平衡 ”得 出 “平衡 ”。 
正式 的 命题 如 下 。 

命题 S(n) 。 如 果 长 度 为 n 的 圆 括号 串 w 是 量变 平衡 的 ， 那 么 它 也 是 平衡 的 。 

依据 。 如 果 n =0， 那么 该 括号 串 一 定 是 e。 由 递归 定义 的 依据 可 知 e 是 平衡 的 。 

归纳 。 假 设 长 度 小 于 等 于 n 的 量变 平衡 括号 串 是 平衡 的 。 必 须 证 明 Sn+1) 为 真 ， 也 就 是 要 
证 明 长 度 为 n+1 的 量变 平衡 括号 串 也 是 平衡 的 。" 考 虑 这 样 一 个 括号 串 w: 因为 w 是 量变 平衡 的 ， 
它 不 可 能 以 右 圆 括号 开头 ， 否 则 它 的 量变 会 立刻 变 为 负 值 。 因 此 ，w 是 以 左 圆 括号 开始 的 。 

将 w 分 为 两 部 分 。 第 一 部 分 从 w 的 开头 开始 ， 到 w 的 量变 第 一 次 变 为 0 截止 。 第 二 部 分 就 是 w 
中 其 余 的 部 分 。 例 如 ， 图 2-17a 所 示 的 量变 第 一 次 变 为 0 是 在 其 末尾 处 ,所 以 如 果 w= (0(0) ， 那 
么 第 一 部 分 就 是 整个 括号 串 ， 而 第 二 部 分 就 是 e。 在 图 2-17b 中 ，w = 0(0)0 ,那么 第 一 部 分 就 是 
0， 而 第 二 部 分 是 (0)0 。 

第 一 部 分 永远 不 可 能 以 左 圆 括号 结尾 ， 因 为 如 果 那 样 ， 那 么 在 结尾 之 前 的 那个 位 置 ， 量 变 
就 为 负 值 了 。 因 此, 第 一 部 分 以 左 圆 括号 开始 , 并 以 右 圆 括号 结尾 。 这 样 就 可 以 将 w 写 为 (907 的 
形式 , 其 中 (x) 是 第 一 部 分 ， 而 ?是 第 二 部 分 。x 和 都 要 比 w 短 , 所 以 如 果 可 以 证 明 它 们 是 量变 平 
衡 的 ， 就 可 以 利用 归纳 假设 推出 它们 是 平衡 的 。 然 后 可 以 使 用 “括号 串 平 衡 ” 定 义 中 的 递归 规 
则 来 证 明 w= (x)y 是 平衡 的 。 

很 容易 看 出 ，y 是 量变 平衡 的 。 图 2-18 还 说 明了 w、x 和 y 的 量变 之 间 的 关系 。 也 就 是 说 ，y 的 
量变 是 w 的 量变 的 尾部 ， 开 始 和 结束 的 高 度 都 是 0。 因 为 w 是 量变 平衡 的 ， 所 以 可 以 得 出 结论 : y 
也 是 量变 平衡 的 。 证明 x 是 量变 平衡 括号 串 的 过 程 也 几 近 相同 。x 的 量变 是 w 的 量变 的 一 部 分 , 它 
的 起 止 高 度 都 是 第 1 级 , 而 且 x 的 量变 也 从 未 低 于 第 1 级 。 可 以 知道 w 的 量变 在 x 这 一 段 从 未 到 过 0， 
因为 我 们 选取 (x) 作为 w 的 最 短 前 级 ,而 在 它 结尾 处 w 的 量变 才 回 到 0。 这 样 ,，w 内 的 x 的 量变 从 未 
到 过 0， 所 以 x 本 身 的 量变 从 未 变 为 负 值 。 

现在 已 经 证 明了 x 和 y 都 是 量变 平衡 的 。 因 为 它们 都 比 w 短 ， 所 以 归纳 假设 适用 于 它们 , 它们 
都 是 平衡 的 。 定 义 “ 插 号 串 平衡 ”的 递归 规则 告诉 我 们 ， 如 果 x 和 y 都 是 平衡 的 ， 那 么 (x)y 也 是 
平衡 的 。 而 w= (x)y ， 所 以 w 也 是 平衡 的 。 我 们 现在 完成 了 归纳 步骤 ， 并 证 明了 命题 S(n) 对 所 
有 的 nn 三 0 都 成 立 。 





















































(D 请 注意 ， 所 有 的 量变 平衡 括号 串 都 刚好 是 偶 长 度 的 ， 所以， 如 果 n+1 为 奇数 ， 就 不 作 说 明了 。 不 过 ， 在 证 明 中 
不 需要 n 为 偶数 。 
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2.6.3 ”习题 


(CD * 证 明 : 示例 2.16 中 给 出 的 词典 顺序 的 定义 和 2.2 节 中 给 出 的 定义 是 相同 的 。 提 示 : 证 明 由 两 部 分 
组 成 ， 每 个 部 分 都 要 通过 归纳 法 进行 证 明 。 对 第 一 个 部 分 假设 根据 示例 2.16 的 定义 有 w<x 。 通 
过 对 i 的 归纳 证 明 如 下 命题 $0 为 真 :“ 如 果 证 明 w<x 需 要 应 用 次 递归 规则 ,那么 根据 2.2 节 中 ' 词 
典 顺序 ”的 定义 有 ，w 先 于 x。” 依 据 情况 为 1=0 。 该 习题 的 第 二 部 分 是 要 证 明 ， 如 果 根 据 2.2 节 
中 词典 顺序 的 定义 有 ，w 先 于 x， 那么 根据 示例 2.16 中 的 定义 有 ，w<x ， 这 里 要 对 w 和 x 从 开头 起 不 
间断 的 相同 字母 数 进 行 归纳 。 

(2) 面 出 以 下 圆 括号 串 的 量变 曲线 。 

@) (0(O) 
(b) 00)(0 
(©) (00)00) 


(d (0(0(0))) 
哪些 是 量变 平衡 的 ”对 那些 量变 平衡 的 圆 括号 串 ， 使 用 2.6 节 中 的 递归 定义 证 明 它 们 是 平衡 的 。 
(3)* 证 明 : 每 个 平衡 圆 括 号 串 ( 按照 2.6 节 中 的 递归 定义 ) 都 是 某 个 算术 表达 式 中 的 圆 括号 串 ( 见 介 
绍 算术 表达 式 定义 的 示例 2.17 ) 。 提 示 : 对 “平衡 圆 括号 ”定义 中 的 递归 规则 在 构建 某 给 定 平衡 
圆 括号 串 的 过 程 中 被 使 用 的 次 数 进行 归纳 ， 以 证 明 该 命题 。 
(4) 说 出 以 下 C 语 言 运 算 符 是 前 级 、 后 级 还 是 中 级 运算 符 ， 以 及 它们 是 一 元 、 二 元 还 是 IL ( 人 近 2 ) 运 
算 符 。 
(a) < 
(b) & 
(Cc) % 
(5) 如 果 熟 悉 UNIX 的 文件 系统 或 类 似 的 系统 ， 请 对 可 能 的 目录 /文件 结构 给 出 递归 定义 。 


(6)* 某 整 数 集合 8 可 通过 以 下 规则 递归 地 和 定义。 
依据 。0 在 S$ 中 。 
归纳 。 如 果 i 在 S 中 ,那么 i+5 和 i+7 也 在 S 中 。 

(a) 不 在 S 中 的 最 大 整数 是 多 少 ? 
(b) 设 是 (a) 小 题 的 答案 。 证 明 ; 不 小 于 7+7 的 整数 都 在 S 中 。 提 示 : 要 注意 到 这 一 题 与 2.4 市 习题 
中 第 (8) 小 题 的 相似 性 ( 虽然 在 这 里 我 们 只 处 理 非 负 整 数 ) 。 

(7) * 通过 对 位 串 长 度 的 归纳 ， 递 归 地 定义 偶 校 验 位 串 集 合 。 提 示 : 最 好 同时 定义 侦 校 验 位 串 和 奇 校 
验 位 串 这 两 个 概念 。 

(8)* 可 以 按照 以 下 规则 定义 已 排序 整数 表 。 
依据 。 由 一 个 整数 组 成 的 表 是 已 排序 的 。 
归纳 。 如 果 已 排序 表 L 的 最 后 一 个 元 素 是 a， 而 且 b 宇 a ,那么 L 后 加 上 5b 也 是 已 排序 表 。 

证 明 : 如 上 所 述 的 对 “已 排序 表 ” 的 递归 定义 与 之 前 对 已 排序 表 的 非 递归 定义 ( 即 由 整数 
a 二 a 三 … 三 a 组 成 的 表 是 已 排序 表 ) 是 等 价 的 。 

请 记 住 ， 这 里 需要 证 明 (a)、(b) 两 个 部 分 。(a) 如 果 由 递归 定义 得 出 表 是 已 排序 的 ， 那 么 根据 非 递 
归 定 义 它 也 是 已 排序 的 ; (b) 如 果 表 由 非 递归 定义 可 知 是 已 排序 的 , 那么 根据 递归 定义 它 也 是 已 排 
序 的 。(a) 部 分 可 以 对 递归 规则 的 使 用 次 数 进行 归纳 ， 而 (b) 部 分 则 可 以 对 表 的 长 度 进行 归纳 。 

(9) ** 如 图 2-15 所 示 ， 每 当 我 们 给 出 递归 定义 ， 就 可 以 按照 生成 对 象 的 “ 轮 次 ”( 也 就 是 为 得 到 对 
象 而 应 用 归纳 步骤 的 次 数 ) 为 已 定义 的 对 象 分 类 。 在 示例 2.15 和 示例 2.16 中 , 描述 每 一 轮 生成 的 
结果 是 相当 简单 的 。 有 时 这 项 工作 却 更 具 挑 战 性 。 请问 该 如 何 刻画 以 下 两 种 情况 中 第 z 轮 生成 的 
对 和 象 ? 

(a) 如 示例 2.17 中 描述 的 算术 表达 式 。 提 示 : 如 果 熟 悉 第 $ 章 要 介绍 的 树 ， 可 以 考虑 表达 式 的 树 表 示 。 
(b) 平 衡 圆 括号 串 。 请 注意 ,示例 2.19 中 所 描述 的 “递归 规则 应 用 次 数 ” 与 找 出 圆 括 号 串 的 轮 次 是 
不 同 的 。 例 如 ，(0)0 使 用 了 3 次 递归 规则 ， 但 是 在 第 二 轮 被 找 出 的 。 





















































2.7” 驯 归 函数 


递归 函数 是 那些 在 自己 的 函数 体 中 被 调用 的 函数 。 这 种 调用 通常 是 直接 的 ， 例 如 ， 也 数 F 
在 它 自己 中 包含 对 F 的 调用 。 不过， 有 时 候 这 种 调用 也 会 是 间接 的 ， 比 如 ， 茶 函数 下 直接 调用 也 
数 F,， 情 又 直接 调用 F;， 等 等 ， 直 到 该 调用 链 中 的 函数 Fi 调用 站。 

人 们 通常 有 这 样 一 种 看 法 ， 就 是 学 习 迭 代 编 程 ， 或 者 说 使 用 非 递 归 的 函数 调用 ， 要 比 学 习 
递归 编程 更 容易 。 诚 然 ， 我们 不 能 完全 否定 这 种 观点 ， 但 我 们 相信 ， 只 要 大 家 有 机 会 对 递归 编 
程 加 以 练习 ， 那 么 它 其 实 也 是 很 简单 的 。 弟 归程 序 往 往 比 等 效 的 的 迭代 程序 更 简洁 且 更 易于 理 
解 。 更 重要 的 是 ， 比 起 迭代 程序 ， 某 些 问题 更 容易 被 递归 程序 击破 。” 


























说 几 句 实在 话 


使 用 递归 存在 潜在 的 缺点 ， 即 在 某 些 计算 机 上 对 函数 的 调用 会 非常 费时 ， 因 而 与 解决 同样 
问题 的 迭代 程序 相 比 ， 递 归程 序 可 能 会 耗 时 更 多 。 不 过 ， 在 很 多 现代 化 的 计算 机 上 ， 函 数 调用 
是 非常 高 效 的 ， 所 以 反对 使 用 递归 程序 的 这 一 理由 已 变 得 不 那么 重要 。 

即便 是 在 函数 调用 机 制 较 慢 的 计算 机 上 ,人 们 也 可 以 对 程序 进行 剖析 ,看 看 程序 的 各 个 部 
分 分 别 花 了 多 少时 间 。 然 后 就 可 以 重新 编写 程序 中 占用 大 部 分 运行 时 间 的 部 分 ， 如 有 必要 就 用 
和 迭代 替代 递归 。 这 样 一 来 ， 除 了 速度 是 最 关键 因素 的 一 小 部 分 代码 之 外 ， 程 序 的 大 半 部 分 都 能 
利用 递归 。 





通常 可 以 通过 模仿 待 实现 程序 的 规范 中 的 递归 定义 ,来 设计 递归 算法 。 实 现 递 归 定 义 的 递 
归 函 数 将 含有 一 个 依据 部 分 与 一 个 归案 部 分 。 依 据 部 分 一 般 会 检查 可 由 定义 的 依据 解决 的 简单 
输入 (不 需要 递归 调用 )。 函数 的 归纳 部 分 则 需要 一 次 或 多 次 对 其 本 号 进 行 递 归 调用 , 并 实现 定 
义 的 归纳 部 分 。 下 面 的 例子 应 该 能 说 明 这 几 点 。 


+ 示例 2.21 

图 2-19 给 出 了 计算 某 个 非 负 整数 z 的 阶乘 值 z! 的 递归 函数 。 该 函数 直接 转换 了 示例 2.15 中 
对 n! 的 递归 定义 。 也 就 是 说 , 图 2-19 的 第 (1) 行 依据 情况 与 归纳 情况 进行 了 区 分 ,我 们 假设 n 三 1， 
所 以 第 (1) 行 的 测试 其 实 就 是 在 问 是 否 有 n=1。 如 果 是 ,我 们 就 在 第 (2) 行 应 用 依据 规则 ， 得 到 
11=1。 如 果 n>1 ， 就 在 第 (3) 行 应 用 归纳 规则 n!= nx(n-D)!。 














int fact(int n) 
(1) if (n <= 1) 
(2) return 1; /* 依 据 */ 
else 
(3) return n*fact (nmn-1); /* 归 纳 */ 
} 








图 2-19 计算 nn 宇 1 时 nl! 的 递归 函数 








J 这 样 的 问题 往往 涉及 某 种 查找 。 例如 ,在 第 5 章 中 我 们 会 看 到 一 些 查 找 树 的 递归 算法 , 这 些 算法 没有 方便 的 迭代 
模拟 (虽然 也 存在 使 用 栈 的 等 价 迭 代 算 法 )。 
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例如 ， 如 果 我 们 调用 fact (4) ， 结 果 就 会 调用 fact (3) ， 然 后 调用 fact (2) ， 再 调用 
fact (1)。 至 此 ，fact (1) 会 应 用 依据 规则 ， 因 为 这 里 有 nn 三 1， 并 为 fact (2) 返 回 值 1。 这 次 
对 fact 的 调用 在 第 (3) 行 完成 ,返回 2 给 fact (3) 。 接 着 ,fact (3) 返 回 6 给 fact (4) ,而 fact (4) 
最 后 会 在 第 (3) 行 返回 24 作 为 答案 。 网 2-20 表 示 了 这 些 调用 和 返回 的 模式 。 























1 返回 24 
fact (4) 








1 返回 6 
fact (3) 





和 返回 2 
et 2) 














图 2-20 调用 fact (4) 所 带 来 的 调用 和 返回 








防御 性 程序 设计 

图 2-19 中 的 程序 说 明了 很 重要 的 一 点 ， 即 编写 递归 程序 时 要 注意 不 让 它们 陷入 无 限 的 调 
用 。 我 们 可 能 暗自 假设 不 会 以 小 于 1 的 参数 来 调用 fact。 当 然 ， 最 好 的 做 法 是 在 调用 fact 之 前 
测试 是 否 有 n 宇 1, 如 果 n 不 满足 这 个 条 件 就 打印 错误 消息 并 返回 某 个 特定 的 值 (比如 0 ), 不 过 ， 
即便 我 们 坚信 不 会 以 小 于 1 的 n 来 调用 fact，, 也 还 是 要 明智 一 些 , 在 依据 情况 中 包含 所 有 的 “ 错 
误 情 况 ”。 这样 一 来 ， 以 错误 的 输入 调用 函数 fact 会 直接 返回 值 ]， 虽然 这 是 不 对 的 ,但 不 至 于 
造成 程序 出 错 ( 其实， 对 1=0 来 说 ， 结 果 为 1 也 是 对 的 ， 因 为 0 的 阶乘 等 于 1 )。 

然而 ， 假 如 忽略 掉 错 误 情 况 ， 并 将 图 2-19 的 第 (1) 行 写成 
主机 ( 三 三 村 

那么 如 果 调 用 了 fact(0) ， 它 就 会 被 看 作 递 归 情 况 的 实例 ， 并 会 接着 调用 fact(-1)、 
fact(-2)， 等 等 ， 直 到 计算 机 用 尽 记 录 递 归 调 用 的 空间 才 会 出 错 终止 。 





























我 们 可 以 像 绘制 归纳 证 明和 归纳 定义 的 图 那样 绘 出 递归 图 。 在 图 2-21 中 ， 假 设 存 在 递归 画 
数 的 参数 “大 小 ”这 样 一 个 概念 。 例 如 ， 对 示例 2.21 中 的 fact 羡 数 而 言 ， 参 数 z 的 值 就 具有 合适 
的 大 小 。 我 们 将 在 2.9 节 中 介绍 更 多 与 这 种 大 小 有 关 的 内 容 。 不 过 , 在 这 里 要 注意 的 是 ,递归 调 
用 只 会 调用 大 小 更 小 的 参数 。 还 有 ， 在 到 达 某 特定 大 小 时 ( 比如 在 图 2-21 中 就 是 大 小 为 0 )， 就 
必须 达到 依据 情况 ， 也 就 是 必须 终止 递归 。 


ee 


图 2-21 说 归 函 数 只 调用 具有 更 小 的 参数 的 本 号 
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2.7 效 归 郊 数 37 





在 fact 郴 数 的 例子 中 , 调用 过 程 不 像 图 2-21 所 示 那 样 具有 一 般 性 。 调 用 fact (mn) 会 导致 对 
fact (n-1) 的 直接 调用 ,但 fact (Pn) 不 会 直接 调用 其 他 具有 更 小 参数 的 fact。 


+ 示例 2.22 

如 果 将 底层 算法 表示 为 如 下 形式 ,就 可 以 将 图 2-2 中 的 SelectionSort 孙 数 变 成 递归 函数 
recSS。 此 处 假设 要 排序 的 数据 是 在 数组 A[0. .n-1] 中 。 

(1) 从 数组 A 的 尾部 ， 也 就 是 从 A[i. .n-1] 中 ， 选 出 最 小 的 元 素 。 

(2) 将 步骤 (1) 中 选 出 的 元 素 与 A[i] 互 换 。 

(3) 将 剩 下 的 数组 ATi+1. .n-1] 进 行 排序 。 

我 们 可 用 如 下 递归 算法 表示 选择 排序 。 

依据 。 如 果 i=n-1, 那么 数组 中 只 有 一 个 元 素 需 要 排序 。 因 为 任意 一 个 元 素 都 是 已 排序 的 ， 
所 以 我 们 什么 都 不 用 做 。 

归纳 。 如 果 交 2 -1， 那么 要 找 出 ATi . .n-1] 中 最 小 的 元 素 , 将 其 与 A[i] 互 换 ， 并 递归 地 
将 A[i+1..n-1] 进 行 排序 。 

整个 算法 是 从 i=0 开始 执行 以 上 递归 的 。 

如 果 将 i 视 作 上 述 归 纳 中 的 归纳 参数 ， 那 么 它 就 是 逆向 归纳 ( backward induction ) 的 例子 。 
我 们 从 参数 最 大 的 依据 开始 ， 通 过 归纳 规则 ， 用 较 大 参数 的 实例 去 解决 较 小 参数 的 实例 ， 这 是 
种 特别 好 的 归纳 风格 ， 虽 然 我 们 之 前 并 未 提 及 它 的 可 能 性 。 不 过 ， 还 可 以 将 上 述 归 纳 视 为 普通 
的 ， 或 是 说 “ 正 向 ”归纳 ， 只 要 将 数组 尾部 待 排序 元 素 的 数目 上 =7 一 作为 归纳 参数 即 可 。 

在 图 2-22 中 ,我 们 看 到 了 recss (A, i,n) 程 序 。 其 第 二 个 参数 i 是 数组 A 未 排序 部 分 第 一 个 
元 素 的 下 标 ， 第 三 个 参数 n 是 数组 A 中 待 排序 元 素 的 总 数 。 不 难看 出 ，n 是 小 于 等 于 数组 A 的 最 大 
大 小 的 。 因 此 ， 调 用 recss (A,0,n) 会 为 整个 数组 A[0..n-1] 排 序 。 


























void recSS(int A[], int i, int n) 
{ 


int j, small, temp; 
if (i < n-1) {/* 依据 是 i = n-1， 在 这 种 情况 下 ， 
该 函数 会 返回 而 不 改变 */ 
/* 归纳 如 下 */ 
small = i; 
for (j = i+1; j < n; j++) 
if (A[j] < A[smal1]) 
small = j; 
temp = ALsmalll]; 
A[small] = A[il]; 
A[i] = temp; 
recSS(A, i+1, n); 
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图 2-22 递归 的 选择 排序 
就 图 2-21 而 言 ，s =n 一 i 对 recSS 子 数 的 参数 来 说 是 合适 的 “大 小 ”概念 。 依据 情况 是 s =1， 
也 就 是 为 一 个 元 素 排序 ， 不 需要 发 生 递归 调用 。 上 归纳 步骤 就 讲述 了 如 何 通过 选 出 最 小 元 素 并 排 
序 剩 下 的 -1 个 元 素来 为 s 个 元 素 排 序 。 
在 第 (1) 行 ， 我们 会 测试 依据 情况 ， 就 是 只 有 一 个 元 素 需 要 排序 的 情况 ( 这 里 我 们 再 次 进行 
了 防御 性 编程 ,这样 一 来 ,就 算 在 调用 时 有 i 宇 n ,也 不 会 造成 无 限 的 调用 ), 在 该 依据 情况 中 ， 
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我 们 无 事 可 做 ， 所 以 直接 返回 。 

函数 其 余部 分 是 归纳 情况 。 第 (2) 至 (8) 行 直接 照搬 了 递归 选择 排序 程序 中 的 内 容 。 就 像 那个 
程序 那样 ， 这 几 行 会 将 数组 ATi . .n-1] 最 小 元 素 的 下 标 赋 值 给 sma11， 并 将 该 元 素 与 ATi] 互 
换 。 最 后 ， 第 (9) 行 是 递归 调用 ， 会 排序 数组 其 余部 分 。 


习题 


(1) 我 们 可 以 按 下 以 下 方式 递归 地 定义 n? 。 
依据 。 对 n=1， 有 1 =1 
归纳 。 如 果 壤 =m ， 那么 (n+1) =m+2n+1。 

(a) 编写 C 语 言 递 归隐 数 实现 该 递归 。 
(b) 通过 对 n 的 归纳 证 明 该 定义 能 正确 地 计算 n 。 

@2) 假设 有 数组 A[0. .4] ， 其 中 有 按 所 述 顺序 排列 的 元 素 10、13、4、7、11。 在 每 次 调用 图 2-22 所 示 
的 递归 函数 recss 之 前 ， 数 组 A 的 内 容 是 怎样 的 ? 

(3) 假设 如 1.3 节 所 述 ， 使 用 1.6 节 给 出 的 Defcell (int ,CELL,LIST) 宏 来 定义 整数 链表 的 节点 。 回 
想 一 下 ， 该 宏 会 扩展 为 如 下 类 型 定义 : 
typedef struct CELL *LIST; 
struct CELL { 

int element ; 

LIST next; 
}; 
编写 递归 孔 数 fijnd， 接 受 LIST 类 型 的 参数 ， 并 在 某 个 链表 节点 含有 整数 1698 作 为 其 元 素 时 返回 
TRUE， 如 果 没 有 则 返回 FALSE。 

(4) 编写 递归 哨 数 aqd， 像 习题 (3) 那 样 接受 LIST 类 型 的 参数 ， 并 返回 表 中 各 元 素 之 和 。 

(5) 使 用 习题 (3) 中 提 到 的 节点 ， 编 写 接受 整数 链表 作为 参数 的 递归 选择 排序 函数 。 

(6) 我 们 在 习题 (8) 中 提出 ， 可 以 将 选择 排序 一 般 化 ， 以 使 用 任意 的 key 和 1t 冰 数 来 比较 元 素 。 重 新 编 
写 递归 的 选择 排序 算法 以 融入 这 种 一 般 性 。 

(7)* 给 出 递归 算法 , 接受 整数 i, 并 生成 的 二 进 制 表 示 形 式 ( 由 0 和 1 组 成 的 序列 ) ,其 中 低位 排 在 前 。 

(8)* 两 个 整数 ;和 的 最 大 公约 数 ( greatest common divisor，GCD ) 是 指 能 整除 i 的 最 大 整数 。 例 如 ， 
gcd(24,30)=6 , 而 gcd(24,35)=1。 编写 递归 水 数 , 接受 两 个 整数 ;大 山 , 其 中 i>j ,并 返回 gcd(i, 7) 。 
提示 : 大 家 可 以 使 用 如 下 所 述 的 gcd 的 递归 定义 ， 它 假设 谊 j。 
依据 。 如 果 ; 能 整除 i， 则 j 是 二 册 的 最 大 公约 数 。 
归纳 。 如 果 ; 不 能 整除 i， 设 f 是 i 除 以 得 到 的 余数 。 那 么 gcd(i, 7 就 和 gcd(j,k) 是 相同 的 。 

(9) ** 证 明 : 习题 (9) 中 给 出 的 最 大 公约 数 递归 定义 和 它 的 非 递 归 定 义 〈 整 除 ? 和 和 /j 的 最 大 整数 ) 能 得 出 
相同 结果 。 

(10) 通常 ， 弟 归 定 义 可 以 相当 直接 地 转化 为 算法 。 例 如 ， 考 虑 一 下 示例 2.16 中 给 出 的 字符 串 “ 小 于 ” 
关系 的 递归 定义 。 编 写 递归 函数 ， 测 试 两 个 给 定 字符 串 中 的 第 一 个 字符 串 是 否 “小 于 ” 另 一 个 字 
符 串 。 假 设 字 符 串 是 用 字符 链表 表示 的 。 

(1)* 根据 2.6 市 的 习题 (9) 中 给 出 的 已 排序 表 的 递归 定义 ,创建 一 种 递归 排序 算法 。 该 算法 与 示例 2.22 
中 的 递归 选择 排序 相 比如 何 ? 
























































有 一 种 攻克 问题 的 方式 ， 是 将 问题 分 解 成 多 个 子 问题 ， 然 后 解决 这 些 子 问题 ， 并 将 它们 的 解决 方案 
结合 成 整个 问题 的 解决 方案 。 术 语 分 治 法 就 是 用 来 描述 这 种 问题 解决 技术 的 。 如 果 这 些 子 问题 和 原 问 题 
相似 ， 那 么 我 们 也 许 能 使 用 相同 的 函数 递归 地 解决 这 些 子 问题 。 
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要 让 这 种 技术 起 作用 ， 有 两 点 要 求 。 首 先是 子 问题 必须 比 原 问 题 简 单 。 其 次 是 在 有 限 次 细 分 之 后 ， 
必须 得 到 能 立即 解决 的 子 问 题 。 如 果 达 不 到 这 些 条 件 ， 递归 算法 就 会 一 直 细 分 问题 ,而 找 不 出 解决 方案 。 

我 们 注意 到 图 2-22 中 的 递归 函数 recSS 就 满足 这 两 个 条 件 。 每 当 调用 该 函数 ， 就 是 对 少 一 个 元 素 的 子 
数列 调用 该 函数 ， 而 在 对 只 含 一 个 元 素 的 子 数列 调用 它 时 ， 它 就 会 返回 而 不 再 继续 调用 自己 。 类 似 地 ， 图 
2-19 中 的 阶乘 程序 会 在 每 次 调用 时 调用 较 小 整数 ， 而 递归 过 程 会 在 调用 参数 到 达 1 时 停止 。2.8 节 讨论 了 分 治 
法 更 为 强大 的 应 用 “归并 排序 ”。 在 这 种 排序 中 ， 待 排序 数组 的 大 小 减 小 得 非常 迅速 ， 因 为 归并 排序 
在 每 次 递归 调用 时 会 将 数组 大 小 砍 掉 一 半 ， 而 不 是 减 去 1。 
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现在 要 考虑 一 种 名 为 归并 排序 的 与 选择 排序 有 着 天 坏 之 别 的 排序 算法 。 递 归 的 方式 能 最 好 
地 描述 归并 排序 , 而 归并 排序 展示 了 分 治 法 的 强大 , 在 这 种 排序 方法 中 , 我 们 通过 将 问题 “分 为 ” 
大 小 减 半 的 两 个 相似 问题 来 为 表 (a,a,…,a, ) 排序 。 从 原则 上 讲 ， 可 以 首先 将 原 表 分 为 两 个 元 素 
任 选 的 大 小 相等 的 表 ， 不 过 在 我 们 开发 的 程序 中 ， 将 会 将 其 分 为 一 个 含有 奇数 编号 元 素 的 表 
(aa 7) ， 以 及 一 个 含有 偶数 编号 元 素 的 表 (a,,ay,a6,…) 。 接着 单独 为 大 小 减 半 的 两 个 表 排 
序 。 要 完成 原 表 中 个 元 素 的 排序 ， 要 使 用 示例 2.23 中 描述 的 算法 来 合并 两 个 大 小 减 半 的 表 。 

在 第 3 章 中 ， 我 们 将 看 到 ， 随 着 待 排序 表 长 度 z 的 增加 ， 归 并 排序 所 需 时 间 的 增长 速度 要 远 
慢 于 选择 排序 所 需 时间 的 增长 速度 。 因 此 ,即便 递归 调用 会 额外 耗费 些 时 间 ， 当 z 很 大 时 ,还 是 
应 该 优先 使 用 归并 排序 而 不 是 选择 排序 。 在 第 3 章 中 我 们 将 分 析 这 两 种 排序 算法 的 相对 性 能 。 


284， 人 癌 于 


“合并 ”是 指 用 两 个 已 排序 表 生 成 一 个 只 包含 这 两 个 表 中 所 有 元 素 的 已 排序 表 。 例 如 ， 假 
设 有 表 ( 1,2,7,7,9 ) 和 (2,4,7,8 )， 合 并 后 的 表 就 是 (1,2,2,4,7,7,7,8,9)。 请 注意 ， 对 未 排序 的 表 谈 
“合并 ”是 没有 意义 的 。 

有 一 种 合并 两 个 表 的 简单 方式 ， 就 是 从 表 开 头 开 始 分 析 它 们 。 在 每 一 步 中 ， 我 们 找 出 两 个 
表 当 前 开头 位 置 的 两 个 元 素 中 较 小 的 那个 ， 选 择 该 元 素 作 为 合并 后 的 表 的 下 一 个 元 素 ， 并 将 该 
元 素 从 它 原来 所 在 的 表 中 删除 ， 使 该 表 具 有 一 个 新 的 “首位 ”元 素 。 虽 然 我 们 在 两 个 表 开 头 的 
元 素 相 同时 会 选取 第 一 个 表 开 头 的 元 素 ， 但 是 持平 关系 的 打破 是 具有 任意 性 的 。 


+ 示例 2.23 

考虑 合并 以 下 两 个 表 。 

LD =(,2,7,7,9) 和 万 =(2,47.9) 

两 个 表 的 第 一 个 元 素 分 别 为 1 和 2 。 因 为 1 比较 小 ， 所 以 将 其 选 作 合并 后 的 表 M 的 第 一 个 元 
素 ， 并 将 1 从 石 中 删除 ,因此 新 的 五 就 是 (2,7,7,9) 。 现 在 ， 五 和 瑟 的 第 一 个 元 素 都 是 2。 可 以 任 
选 其 一 。 假 设 采取 持平 情况 下 总 是 从 工 中 选取 元 素 的 策略 ， 那 么 合并 后 的 表 M 就 变 为 (1,2) ， 表 
五 变 为 (7,7,9) ， 而 荆 仍 为 (2,4,7,8) 。 图 2-23 所 示 的 表格 展示 了 直到 和 工 ,双双 耗 尽 的 整个 合 
并 步 又 。 


















































QD 请 记 住 ,，“ 奇 数 编号 ”和 “偶数 编号 ” 指 的 是 元 素 在 表 中 的 位 置 ， 而 非 这 些 元 素 的 值 。 
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1 .2253 2，4，7， 
2 11 2，4，7， 
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图 2-23 合并 的 例子 
我 们 将 会 发 现 ， 如 果 把 表 表 示 为 1.3 节 所 介绍 的 链表 ,设计 归并 算法 的 工作 会 更 人 简单。 链表 


将 会 在 第 6 章 中 得 到 更 为 详细 的 介绍 。 接 着 ， 








要 假设 表 的 元 素 都 为 整数 。 因 此 ， 每 个 元 素 都 能 





示 为 一 个 “单元 ”， 或 者 说 是 struct CELIL 类 型 的 结构 体 ， 而 表 则 表示 为 指向 CELL 的 LIST 类 
型 的 指针 。 这 些 定义 都 是 由 我 们 在 1.6 节 中 讨论 过 的 DefCell (int，CELL，LIST) 宏 来 定义 


的 。 这 种 对 Defcel1 宏 的 使 用 会 扩展 为 : 
typedef struct CELL *LIST; 
struct CELL { 
int element; 
LIST next; 





}; 

















每 个 单元 的 element 字 上 段 都 含有 一 个 整数 ， 而 next 字 有 段 则 含有 指向 表 中 下 一 单元 的 指针 。 


如 果 当 前 的 元 素 是 表 中 最 后 一 个 元 素 ，nex 





t 字 上 段 就 含有 表示 空 指针 的 值 NULL。 然 后 整 列 整数 








就 会 用 指向 表 第 一 个 单元 的 指针 〈 即 一 个 LIST 类 型 的 变量 ) 来 表示 。 而 空 表 会 用 值 为 NULL 的 





变量 ( 而 不 是 指向 第 一 个 元 素 的 指针 ) 来 表 


不。 





图 2-24 是 归并 算法 的 C 语 言 实 现 。 merge 也 数 接受 两 个 表 作为 参数 , 并 返回 合并 后 的 表 。 也 
就 是 说 ， 形 式 参 数 1ist1 和 1ist2 是 指向 两 个 给 定 表 的 指针 ， 而 返回 值 是 指向 合并 后 的 表 的 指 





针 。 递 归 算 法 可 摘 述 为 如 下 形式 。 





LIST merge(LIST listi1, LIST list2) 
{ 
(1) if (list1i == NULL) return list2; 
(2) else if (list2 == NULL) return listi; 
(3) else if (list1i->element <= list2->element) { 
/* 在 这 里 ， 两 个 表 都 不 为 空 ， 
而 且 第 一 个 表 的 首 个 元 素 更 小 。 
得 到 的 结果 就 是 第 一 个 表 的 第 一 个 元 素 ， 
后 面 跟 上 其 余 元 素 的 合并 。*/ 
(4) list1->next = merge(list1->next, list2); 
(5) return listi; 
} 
else { /* list2 的 首 个 元 素 更 小 */ 
(6) list2->next = merge(list1i, list2->next); 
(7) return list2; 
} 
} 





图 2-24 递归 的 合并 
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依据 。 如 果 任 一 表 为 空 ， 那 么 另 一 个 表 就 是 所 需 的 结果 。 这 条 规则 是 通过 图 2-24 中 的 第 (]) 
行 和 第 (2) 行 实现 的 。 请 注意 ， 如 果 两 个 表 都 为 空 ， 就 将 返回 11ist2。 不 过 这 是 正确 的 ， 因 为 这 
里 1ist2 的 值 是 NULL， 而 两 个 空 表 的 结合 还 是 空 

归纳 。 如 果 两 个 表 都 不 为 空 ， 那 么 每 个 表 都 有 第 一 个 元 素 。 我 们 可 以 将 两 个 表 的 第 一 个 元 
素 分 别称 为 1ist1->element 和 1ist2->element， 即 分 别 由 1ist1 和 1ist2 指 向 的 单元 的 
element 字 段 。 图 2-25 展 示 了 这 种 数据 结构 。 返 回 的 表 从 含有 最 小 元 素 的 单元 开始 。 该 返回 表 
其 余 的 部 分 由 两 个 表 中 除 这 个 最 小 元 素 之 外 的 所 有 元 素 组 成 。 























归并 列表 





图 2-25 ”归并 算法 的 归纳 步 又 

例如 ， 第 (4) 行 和 第 (5) 行 处 理 的 是 最 小 元 素 为 表 1 中 第 一 个 元 素 的 情况 。 第 (4) 行 是 对 merge 
函数 的 递归 调用 。 该 调用 的 第 一 个 参数 是 1ist1->next， 也 就 是 指向 表 1 中 第 二 个 元 素 的 指针 
(如 果 表 1 只 有 一 个 元 素 则 为 NULL )。 因 此 , 传人 该 递归 调用 的 是 由 表 1 中 除 第 一 个 元 素 之 外 的 所 
有 元 素 组 成 的 表 。 第 二 个 参数 是 整个 表 2。 因 此 ， 第 (4) 行 中 对 merge 函 数 的 递归 调用 会 返回 一 
个 指针 , 指 回合 并 后 的 表 中 其 余 所 有 元 素 , 并 将 该 指向 合并 后 的 表 的 指针 存储 在 表 1 第 一 个 单元 
的 next 字 段 中 。 在 第 (5) 行 , 我 们 会 返回 指 癌 上 述 单元 的 指针 , 该 单元 现在 已 经 是 合并 后 的 表 所 
有 元 素 中 的 第 一 个 单元 。 

图 2-25 展 示 了 这 种 变化 。 虚 线 表示 的 箭头 会 在 merge 被 调用 时 出 现 。 特别 要 说 的 是 , merge 
的 返回 值 是 指 癌 最 小 元 素 所 在 单元 的 指针 , 而且 该 元 素 的 next 字 段 是 指 问 第 (4) 行 对 merge 的 递 
归 调 用 所 返回 的 表 。 

最 后 ， 第 (6) 行 和 第 (7) 行 会 处 理 最 小 元 素 在 表 2 中 的 情况 。 该 算法 的 行为 与 第 (4) 行 和 第 (5) 行 
中 的 行为 是 一 样 的 ， 只 不 过 两 个 表 的 角色 互 换 了 而 已 。 

+ 示例 2.24 

假设 我 们 对 示例 2.23 中 的 表 (1,2,7,7,9) 和 (2,4,7,8) 调用 merge。 图 2-26 展 示 了 进行 合并 所 产 
生 的 调用 序列 ， 是 按照 第 一 列 中 由 上 向 下 的 顺序 进行 调用 的 。 在 图 中 我 们 省 去 了 分 隔 表 元 素 的 
如 号 ， 不 过 在 分 隔 进 行 合 并 的 参数 时 要 用 到 逗号 。 












































调 用 返 回 
nerge (12779,2478) 122477789 
erge (2779,2478) 22477789 
erge (779,2478) 2477789 
nerge (779,478) 477789 
nerge (779,78) 77789 
erge (79,78) 7789 
erge (9,78) 789 
nerge (9,8) 89 
nerge (9, NULL) 9 





图 2-26 ”对 merge 也 数 的 递归 调用 
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例如 ， 因 为 表 1 的 第 一 个 元 素 比 表 2 的 第 一 个 元 素 小 ， 所 以 会 执行 图 2-24 的 第 (4) 行 ， 而 且 我 
们 会 归并 除 表 1 第 一 个 元 素 之 外 的 所 有 元 素 。 也 就 是 说 ， 第 一 个 参数 是 表 1 其 余 的 部 分 ， 即 
(2,7,7,9) ， 而 第 二 个 参数 就 是 整个 表 2， 即 (2,4,7,8) 。 现 在 两 个 表 开 头 的 元 素 是 相同 的 。 因 为 
图 2-24 中 第 (3) 行 的 测试 偏向 表 1 ， 所 以 我 们 从 表 中 移出 2， 而 对 merge 函 数 的 下 一 次 调用 中 ， 第 
一 个 参数 就 是 (7,7,9) ， 第 二 个 参数 还 是 (2,4,7,8) 。 

返回 的 表 在 第 二 行 中 表示 ， 是 按 从 下 向 上 的 顺序 看 的 。 请 注意 ， 与 图 2-23 中 合并 的 迭代 描 
述 不 同 的 是 , 递归 算法 会 从 尾部 起 组 成 合并 后 的 表 , 而 迭代 算法 则 是 从 头 开始 组 成 合并 后 的 表 。 


2.8.2 “分割 表 


归并 排序 的 另 一 项 重要 任务 是 将 一 个 表 均 分 为 两 个 表 ， 或 者 ， 如 果 原 表 的 长 度 为 奇数 ， 就 
分 为 长 度 只 相差 1 的 两 个 表 。 要 完成 这 一 工作 ， 一 种 方式 是 数 出 表 中 元 素 的 数目 ， 然 后 除 以 2， 
并 在 表 的 中 点 将 其 拆 分 。 我 们 将 给 出 一 个 简单 的 递归 因数 spl1it， 将 这 些 元 素 “ 处 理 ” 进 两 个 
表 , 其 中 一 个 表 由 第 1 个 、 第 3 个 、 第 5 个 等 元 素 组 成 ， 而 男 一 个 表 则 由 偶数 位 置 的 元 素 组 成 。 更 
确切 地 说 ，sp1 计 困 数 会 将 偶数 编号 的 元 素 从 作为 参数 给 出 的 表 中 删除 ， 并 返回 一 个 由 这 些 偶 
数 编号 元 素 组 成 的 新 表 。 

sp1 让 函数 的 C 语 言 代 码 如 图 2-27 所 示 ， 它 的 参数 是 LIST 类 型 的 表 ， 这 样 定义 是 和 merge 郴 
数 有 关 的 。 请 注意 ,局 部 变量 pSecondqce11 被 定义 为 LIST 类 型 。 这 里 是 将 pSecondqcel11 用 作 指 
问 表 第 二 个 单元 ( 而 不 是 指 问 表 本 里 ) 的 指针 ， 不 过 其 实 LIST 类 型 当然 是 指 回 单元 的 指针 。 
































LIST split(LIST list) 
{ 
LIST pSecondCell; 


if (list == NULL) return NULL ; 

else if (list->next == NULL) return NULL ; 

else { /* there are at least two cells +*/ 
pSecondCell = list->next; 
list->next = pSecondCell->next; 
pSecondCell->next = split(pSecondCell->next); 
return pSecondCell; 

} 

} 





图 2-27 ”将 表 均 分 为 两 部 分 

split 是 个 具有 副作用 的 函数 。 它 会 从 作为 参数 给 出 的 表 中 删除 偶数 位 置 的 单元 ， 而 且 它 
会 将 这 些 单元 组 合成 一 个 作为 该 函数 返回 值 的 新 表 。 

我 们 能 以 如 下 形式 ， 用 归纳 的 方式 描述 该 分 割 算法 。 它 对 表 的 长 度 进 行 了 归纳 ， 这 段 归纳 
具有 多 个 依据 情况 。 

依据 。 如 果 表 的 长 度 为 0 或 1， 那 么 我 们 什么 都 不 用 做 。 这 就 是 说 ， 空 表 会 被 “分 割 成 ”两 
个 空 表 ， 而 只 有 一 个 元 素 的 表 ， 在 分 割 时 会 将 唯一 的 元 素 留 在 给 定 的 表 中 ， 并 返回 一 个 空 的 偶 
数 编号 元 素 表 (因为 原 表 没有 偶数 编号 的 元 素 ， 所 以 这 个 表 中 没有 元 素 )。 该 依据 是 由 图 2-27 所 
示 程 序 的 第 (1) 行 和 第 (2) 行 处 理 的 。 第 (1) 行 处 理 的 是 1ist 为 空 的 情况 ， 而 第 (2) 行 处 理 的 则 是 
list 中 只 含 一 个 元 素 的 情况 。 请 注意 , 我 们 在 第 (2) 行 中 会 避免 去 检查 1ist->next, 除非 之 前 
在 第 (1) 行 中 已 经 确定 1ist 不 为 NULL。 

归纳 。 归 纳 步 又 适用 于 1ist 中 至 少 存在 两 个 元 素 的 情况 。 第 (3) 行 中 局 部 变量 pSecondCel1l 
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中 存放 了 指向 表 第 二 个 单元 的 指针 ; 第 (4) 行 则 是 使 第 一 个 单元 的 next 字 段 跳 过 第 二 个 单元 , 直 
接 指 向 第 三 个 单元 , 或 者 ， 如 有 果 表 中 只 有 两 个 单元 ， 就 变 为 NULL; 在 第 (3) 行 ,我 们 对 除 前 两 个 
元 条 之 外 的 整个 表 弟 归 地 调用 split 函 数 ; 而 split 函 数 会 在 第 (6) 行 返回 一 个 指向 第 二 个 单元 
的 指针 ， 该 指针 让 我 们 可 以 访问 由 原 表 中 所 有 偶数 编号 的 元 素 组 成 的 链表 。 

split 带 来 的 变化 如 图 2-28 所 示 。 原 始 指 针 用 虚线 表示 ， 而 新 指针 用 实 线 表示 。 我 们 还 指 
出 了 创建 每 个 新 指针 的 代码 行 编号 。 








对 split 的 递归 调用 


pSecondCell 


(6) 
返回 值 


图 2-28 split 函数 的 动作 
2.8.3 ”排序 算法 
递归 的 排序 算法 如 图 2-29 所 示 ， 该 算法 可 以 通过 以 下 依据 与 归纳 步骤 来 描述 。 








LIST MergeSort (LIST list) 
+ 
LIST SecondList; 


(1) if (list == NULL) return NULL ; 
(2) else if (list->next == NULL) return list; 
else 荆 
/* 表 中 至 少 有 两 个 元 素 */ 
(3) SecondList = split(list); 
/* 请 注意 ， 这 样 做 的 副作用 是 有 一 半 元 素 会 从 表 中 删除 */ 
(4) return merge(MergeSort(list), MergeSort (SecondList)); 
} 
} 





图 2-29 ”归并 排序 算法 
依据 。 如 果 竺 排序 的 表 为 空 或 长 度 为 1, 那么 只 要 返回 该 表 即 可 ， 因 为 它 是 已 排序 的 。 该 依 
据 是 由 图 2-29 中 的 第 (1) 行 和 第 (2) 行 处 理 的 。 
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归纳 。 如 有 果 待 排序 表 的 长 度 至 少 为 2， 那 么 在 第 (3) 行 使 用 split 函 数 ， 从 1ist 中 删除 偶数 
编号 的 元 素 , 并 使 用 这 些 被 删除 的 元 素 组 成 男 一 个 表 , 该 表 是 由 局 部 变量 SecondLi st 指向 的 。 
第 (4) 行 会 递归 地 为 大 小 减 半 的 表 排 序 ， 并 返回 这 两 个 表 的 归并 结果 。 


+ 示例 2.25 

让 我 们 用 归并 排序 为 一 列 一 位 数 数字 742897721 排 序 。 为 求 简洁 , 我 们 再 次 省 略 了 数字 之 间 
的 有 逗号。 首先 , 通过 MergeSort 抑 数 第 (3) 行 中 对 split 的 调用 , 表 会 被 分 为 两 个 部 分 。 生 成 的 
两 个 表 中 有 一 个 是 由 奇数 位 置 的 元 素 组 成 ， 另 一 个 则 由 偶数 位 置 的 元 素 组 成 。 也 就 是 说 ， 这 里 
有 1ist=72971, 而 SecondqList = 4872。 在 第 (4) 行 , 这 两 个 表 会 被 排序 ， 结 果 就 成 了 表 12779 
和 2478， 然 后 就 会 合并 成 已 排序 表 122477789。 

不 过 ， 这 两 个 大 小 减 半 的 表 的 排序 工作 并 不 是 凭空 进行 的 ， 而 是 通过 对 该 递归 算法 的 合理 
应 用 做 到 的 。 一 开始 ， 如 果 作 为 MergeSort 参 数 的 表 长 度 大 于 1， 那 么 MergeSort 就 会 将 其 分 割 。 
图 2-30a 展 示 了 对 表 进 行 递归 分 制 ， 直 到 每 个 表 的 长 度 都 成 1 为 止 。 然 后 分 割 的 表 会 成 对 地 合并 
起 来 , 沿 着 树 结构 向 上 ， 直 到 整个 表 完 成 排序 。 这 个 过 程 如 图 2-30b 所 示 。 不 过 , 值得 注意 的 是 ， 
分 割 和 合并 操作 是 交替 进行 的 , 而 不 是 在 完成 所 有 分 割 工 作 后 再 进行 合并 。 例 如 ,第 一 半 表 72971 
会 在 开始 处 理 第 二 半 表 4872 前 被 完全 分 割 及 合并 。 



































742897721 
ee “= 
791 4 和 ~, 47 ~ - 
ZN LN 2 /\ 
71 9 2 7 4 7 8 2 
4 
7 1 
(a) 分 割 
122477789 


(b) 合并 
图 2-30 ”递归 的 分 制 和 合并 
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2.8.4 完整 的 程序 


图 2-31 包 含 了 完整 的 归并 排序 程序 。 它 类 似 于 图 2-3 中 所 示 的 选择 排序 程序 。 第 (1) 行 中 
MakeList 图 数 读 取 输 入 的 每 个 整数 ， 并 通过 一 个 简单 的 递归 算法 将 其 放 人 链表 中 【我 们 将 在 
下 一 节 中 详细 描述 该 递归 算法 )。 主 程序 的 第 (2) 行 含有 对 Mergesort 的 调用 ， 会 将 一 个 已 排序 
表 返 回 给 PrintList。 而 PrintList 上 因数 会 向 下 遍历 整个 已 排序 表 ， 打 印 出 每 个 元 素 。 

















#include <stdio .h> 
#include <stdlib.h> 


typedef struct CELL *LIST; 
struct CELL 

int element; 

LIST next; 
}; 


LIST merge(LIST listi, LIST list2); 
LIST split(LIST list); 

LIST MergeSort (LIST list); 

LIST MakeList() ; 

void PrintList(LIST list); 


main() 
{ 
LIST 1ist; 
(1) list = MakeList() ; 
(2) PrintList (MergeSort (list)); 
} 
LIST MakeList() 
{ 
int x; 
LIST pNewCell; 
(3) if (scanf ("%d", &x) == EOF) return NULL; 
else 工 
(4) pNewCell = (LIST) malloc(sizeof (struct CELL) ) ; 
(5) pNewCell->next = MakeList() ; 
(6) pNewCell->element = x; 
(7) return pNewCell; 
} 
} 
void PrintList(LIST list) 
{ 
(8) while (list != NULL) { 
(9) printf("%d\n", list->element); 
(10) list = list->next; 
} 








图 2-31(a) 使 用 归并 排序 的 排序 程序 ( 开头 ) 
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LIST MergeSort (LIST list) 
{ 
LIST SecondList; 


if (list == NULL) return NULL ; 
else if (list->next == NULL) return list; 
else { 
SecondList = split (list); 
return merge(MergeSort (list), MergeSort (SecondList)); 


} 


LIST merge(LIST listi, LIST list2) 
{ 
if (listi == NULL) return list2; 
else if (list2 == NULL) return listil; 
else if (list1i->element <= list2->element) + 
list1i->next = merge(list1i->next, list2); 
return listi; 
} 
else 
list2->next = merge(list1i, list2->next); 
return list2; 


} 


LIST split(LIST list) 
{ 
LIST pSecondCell; 


if (list == NULL) return NULL; 

else if (list->next == NULL) return NULL ; 

else +{ 
pSecondCell = list->next; 
list->next = pSecondCell->next,; 
pSecondCell->next = split(pSecondCell->next); 
return pSecondCell,; 











图 2-31(b) “使 用 归并 排序 的 排序 程序 (结尾 ) 


2.8.5 ”习题 


(1) 给 出 对 表 (2,3,4,5) 和 (2,4,6,8,10) 应 用 merge 函 数 的 结 

(2) 假设 一 开始 有 表 (8,7,6,5,4,3,2,1) ， 给 出 产生 的 merge、 sp1it 和 Meroesort 的 调用 序 列 。 

(3)* 多 路 归并 排序 会 将 一 个 表 均 分 为 个 部 分 (或 分 为 接近 均等 的 k 个 部 分 ) ， 并 分 别 为 这 些 表 排序 ， 
然后 , 通过 比较 这 K 个 表 中 第 一 个 元 素 的 大 小 并 选 出 最 小 的 那个 , 将 这 些 表 合 并 起 来 。 本 节 中 描述 
的 归并 算法 就 是 上 E= 2 时 的 情况 。 修 改 图 2-31 中 的 程序 ， 使 其 成 为 E=3 情况 下 的 多 路 归并 排序 
程序 。 

(4)* 重 写 归 并 排序 程序 ， 使 用 2.2 节 习题 (7) 中 的 1t 和 key 函 数 ， 以 比较 任意 类 型 的 元 素 。 

(5) 将 函数 merge、 Ri 这 些 函 数 合适 的 大 小 各 为 多 少 ? 
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2.9 ”证 明 束 归程 序 的 属性 


如 果 想 证 明 某 个 递归 函数 的 某 个 特定 属性 ， 通 常 需 要 证 明 关 于 调用 一 次 该 函数 的 效果 的 命 
题 。 例 如 ， 这 种 效果 可 能 是 参数 和 返回 值 之 间 的 关系 ， 比 如 “调用 因数 ， 参 数 为 ， 返回 好 。 我 
们 经 常 要 为 函数 的 参数 定义 “大 小 ”的 概念 ， 并 通过 对 这 个 大 小 的 归纳 进行 证 明 。 可 以 用 很 多 
方式 定义 参数 大 小 ， 其 中 包括 如 下 内 容 。 

(1) 某 个 参数 的 值 。 比 如 ， 在 图 2-19 的 阶乘 递归 程序 中 ， 合 适 的 参数 大 小 就 是 参数 n 的 值 。 

(2) 某 个 参数 指 困 的 表 的 长 度 。 图 2-27 所 示 的 split 递 归 函 数 就 是 个 例子 ,合适 的 参数 大 小 
是 表 的 长 度 。 

(3) 参数 构成 的 某 些 函数 。 例 如 ， 前 面 提 到 过 ， 网 2-22 中 递归 的 选择 排序 会 对 数组 中 有 待 排 
序 的 元 素数 目 进 行 归 纳 。 对 参数 n 和 i 来 说 ,该 函数 就 是 n-it1。 再 比如 ， 图 2-24 中 merge 函 数 合 
适 的 参数 大 小 就 是 两 个 参数 指 癌 的 表 的 长 度 之 和 。 

不 管 选 择 了 什么 样 的 参数 大 小 , 关键 是 , 在 函数 被 调用 时 ， 如 果 参 数 的 大 小 为 9*， 那 么 只 能 
以 大 小 为 s 一 1 或 更 小 的 参数 执行 函数 调用 。 这 样 我 们 可 以 对 参数 大 小 进行 归纳 ， 从 而 证 明 程 序 
的 属性 。 此 外 ， 当 这 个 大 小 下 降 到 某 个 固定 的 值 (例如 0 ) 时 ,该 函数 一 定 不 会 再 进行 递归 调用 
了 ， 因 而 我 们 可 以 由 依据 情况 开始 进行 归纳 证 明了 。 





























+ 示例 2.26 

考虑 2.7 节 图 2-19 中 的 阶乘 程序 。 通 过 对 i 的 归纳 ， 证 明 对 i 三 1 ， 有 如 下 命题 为 真 。 

命题 SQ) 。 在 调用 fact 时 如 果 参 数 n 的 值 为 i， 那 么 fact 会 返回 71!。 

依据 。 对 i= 1， 图 2-19 中 第 (1) 行 的 测试 会 使 作为 依据 的 第 (2) 行 被 执行 ， 结果 返回 值 为 1，, 也 
就 是 1!。 

归纳 。 假 设 SQ) 为 真 ， 也 就 是 说 ， 在 调用 fact 时 ， 如 果 参 数 为 某 个 值 不 小 于 1 的 i， 那 么 它 
会 返回 i。 现 在 ,考虑 在 调用 fact 时 ,变量 n 的 值 为 计 1 的 情况 。 如 果 i 三 1 ,那么 计 1 至 少年 于 2， 
所 以 第 (3) 行 的 归纳 情况 是 适用 的 ,因此 返回 值 就 是 nx jact(z -1D ,或 者 有 ,因为 变量 n 的 值 为 it1， 
返回 的 结果 是 (i+]D)x fact(?) 。 由 归纳 假设 ，fact (i) 返 回 了 i 让。 因为 有 (i+t1) xil=(i+1)!， 所 
以 证 明了 归纳 步 皆 ， 也 就 是 参数 为 计 1 的 fact 隐 数 会 返回 (i+1)!。 


+ 示例 2.27 

现在 , 我 们 来 看 看 2.8 节 图 2-31a 中 的 辅助 例 程 一 MakeList 涵 数 。 该 也 数 会 创建 一 个 用 来 
存放 输入 元 素 的 链表 ， 并 返回 指向 该 链表 的 指针 。 我 们 要 对 输入 序列 中 元 素 的 数目 z 进 行 归纳 ， 
证 明 对 n 三 0， 有 以 下 命题 为 真 。 

命题 Stn) 。 若 输入 序列 为 x 、xs、…、% 则 MakeList 会 创建 一 个 含有 x1、xo、…、x, 的 链表 ， 
并 返回 指 回 该 链表 的 指针 。 

依据 。 依 据 为 n= 0 ， 也 就 是 ， 当 输入 序列 为 空 时 的 情况 。 第 (3) 行 中 MakeList 羡 数 对 EOF 
的 测试 会 导致 返回 值 被 置 为 NULD。 因 此 ，MakeList 正 确 地 返回 了 空 链表 。 

归纳 。 假 设 对 n 三 0 ， 有 Sln) 为 真 ， 并 考虑 对 有 7+1 个 元 素 的 序列 调用 MakeList 时 会 发 
生 的 和 情况。 假设 我 们 刚 读 取 了 第 一 个 元 素 x 。 

MakeList 的 第 (4) 行 会 创建 指向 新 单元 c 的 指针 。 由 归纳 假设 ,第 (5) 行 会 递归 调用 
Makeli st 创建 一 个 指针 ， 指 问 存 放 其 余 n 个 元 素 x:、x;3、…、xn4! 的 链表 。 该 指针 在 第 (5) 行 会 被 
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装 和 人 c 的 next 字 段 。 第 (6) 行 则 会 将 za 装 入 c 的 element 字 段 。 第 (7) 行 会 返回 第 (4) 行 所 创建 的 指 
针 。 该 指针 指向 存放 Xx、xo、…、xntl 这 n+1 个 输入 元 素 的 链表 。 
这 样 就 证 明了 归纳 步 又， 并 得 出 MakeList 能 正确 处 理 所 有 输入 的 结论 。 


+ 示例 2.28 
在 最 后 一 个 示例 中 ， 要 证 明 图 2-29 中 归并 排序 程序 的 正确 性 ， 其 中 假设 sp1it 和 merge 郴 
数 分 别 能 正确 执行 它们 的 任务 。 我 们 要 对 作为 MergeSort 函 数 的 参数 的 表 的 长 度 进行 归纳 。 要 
通过 对 不 小 于 0 的 “进行 完全 归纳 来 证 明 的 命题 如 下 。 
命题 S(n) 。 如 果 1ist 是 MergeSort 被 调用 时 长 度 为 x 的 表 ， 那 么 MergeSort 将 返回 具有 
相同 元 素 的 已 排序 表 。 
依据 。 要 使 用 S(0) 和 SQ) 作为 依据 。 当 1ist 的 长 度 为 0 时 ， 它 的 值 为 NULL， 因 此 图 2-29 中 
第 (1) 行 的 测试 会 成 功 ， 而 整个 函数 会 直接 返回 NULL。 同 样 ， 如 果 1ist 的 长 度 是 1， 第 (2) 行 的 
测试 会 成 功 ， 函 数 就 会 直接 返回 1ist。 因 此 ，MergeSort 拯 数 在 n 等 于 0 或 1 时 会 返回 ] ist。 
这 一 结果 证 明了 S(0) 和 S() ， 因 为 长 度 为 0 或 1 的 表 本 来 就 是 已 排序 的 。 
归纳 。 假设 n 三 1, 而 且 对 所 有 的 i=0、1、…n, 都 有 SQ 为 真 。 我们 必须 要 证 明 Sn+]) 为 
真 。 因 此 ， 要 考虑 长 度 为 n+1 的 表 。 因 为 n 三 1 ， 所 以 表 的 长 度 至 少 为 2， 这 样 就 到 达 了 图 2-29 
中 的 第 (3) 行 ,在 那里 , 如 果 表 的 长 度 n+1 为 偶数 , split 就 会 把 该 表 分 为 两 个 长 度 都 为 (n+1)/2 
的 表 ， 否 则 如 果 n+1 为 奇数 ， 就 分 为 长 度 分 别 为 (n/2)+1 和 /2 的 两 个 表 。 因 为 n 三 1 ， 所 以 
这 些 表 的 长 度 不 可 能 达到 n+1。 这 样 的话 ， 归 纳 假设 适用 于 它们 ， 我 们 就 可 以 由 此 得 出 绪论， 
通过 对 第 (4) 行 的 递归 调用 ， 正 确 地 对 长 度 减 半 的 表 进行 了 排序 。 我 们 已 假设 merge 是 能 正确 工 
作 的 ， 所 以 返回 的 表 也 是 已 排序 的 。 
习题 
(D 证 明 : 图 2-3lb 中 的 PrintList 函 数 会 打印 出 作为 参数 传人 的 表 中 的 元 素 。 需 要 递归 证 明 的 命题 
SO) 是 什么 ? 作为 依据 的 ; 值 是 多 少 ? 
(2) 图 2-32 中 的 sum 函 数 可 以 计算 给 定 表 中 各 元 素 之 和 ， 该 表 中 的 单元 具有 1.6 节 中 的 Defcel11 宏 所 定 
义 的 常见 类 型 ， 这 些 类 型 在 2.8 节 中 的 归并 排序 程序 中 使 用 过 。 它 是 通过 将 第 一 个 元 素 加 在 剩余 元 
素 的 和 上 计算 所 有 元 素 之 和 的 ， 而 这 里 提 到 的 剩余 元 素 之 和 ， 是 通过 对 表 剩 余部 分 递归 调用 该 郴 
数 计算 的 。 证 明 : sum 函 数 可 以 正确 地 计算 表 元 素 之 和 。 需 要 归纳 证 明 的 命题 SQi) 是 什么 ”作为 
依据 的 ; 值 是 多 少 ? 




















DefCell(int, CELL, LIST); 


int sum(LIST L) 
{ 
if (L == NULL) return 0; 
else return(L->element + sum(L->next)); 


int findO(LIST L) 
if (L == NULL) return FALSE; 


else if (L->element == 0) return TRUE ; 
else return find0(L->next) ; 








图 2-32 ”递归 函数 sum 和 fina0 
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(3) 如 果 表 中 的 元 素 至 少 有 一 个 为 0， 那 么 图 2-32 中 的 findq0 函 数 会 返回 TRUE ， 和 否则 就 返回 FALSE。 
如 果 表 为 空 ， 它 就 返回 FALSE， 而 如 果 第 一 个 元 素 是 0， 就 返回 TRUE， 不 然 的 话 ， 就 对 表 其 余部 
分 执行 递归 调用 ， 并 返回 为 剩余 部 分 生成 的 任何 答案 。 证 明 : fing0 可 以 正确 地 确定 表 中 是 否 出 
现 元 素 0。 需 要 归纳 证 明 的 命题 SG) 是 什么 ? 作为 依据 的 ; 值 是 多 少 ? 

(4)* 证明 : 图 2-24 中 的 merge 函 数 和 图 2-27 中 的 split 函 数 会 按 2.8 节 中 所 说 的 那样 执行 。 

(5) 用 “最 少 反 例 ” 直 观 地 证 明 从 以 0 和 1 两 个 值 为 依据 开始 的 归纳 证 明 是 有 效 的 。 

(6) ** 证 明 2.7 节 习题 (8) 中 用 C 语 言 实现 的 递归 的 最 大 公约 数 算法 的 正确 性 。 

















2.10 小结 


我 们 从 本 章 学 习 到 了 以 下 知识 。 

口 归纳 证 明 、 递 归 定 义 和 递 归程 序 是 紧密 相关 的 概念 。 它 们 要 想 “ 起 作用 ”, 都 依赖 于 依据 
和 归纳 步骤。 

D 在 “普通 归纳 ”或 者 说 是 “ 弱 归 纳 ” 中 ,成 功 的 那 一 步 又 只 依 重 它 的 前 一 个 步骤。 我 们 
经 常 需 要 进行 完全 归纳 证 明 ， 而 完全 归纳 中 每 个 步骤 都 取决 于 之 前 的 所 有 步骤 。 

D 进行 排序 的 方法 有 很 多 。 选 择 排序 是 一 种 简单 但 速度 很 慢 的 排序 算法 ， 而 归并 排序 是 一 
种 速度 比较 快 但 比较 复杂 的 算法 。 

D 归纳 是 证 明 程 序 或 程序 段 能 正确 运转 的 关键 。 

口 分 治 法 是 一 种 用 来 设计 某 些 优秀 算法 〈 比如 归并 排序 ) 的 实用 技术 。 它 的 工作 原理 是 将 
问题 分 为 独立 的 子 部 分 ， 然 后 将 得 到 的 结果 结合 起 来 。 

口 表达 式 天 生 是 由 它们 的 操作 数 和 运算 符 按 照 递归 方式 定义 的 。 运 算 符 可 以 按照 它们 接受 
参数 的 数量 来 分 类 : 一 元 运算 符 〈 一 个 参数 ) 二 元 运算 符 〈 两 个 参数 ) 以 及 K 元 运算 符 
(CK 个 参数 ) 还 有 , 出 现在 两 个 操作 数 之 间 的 二 元 运算 符 是 中 绥 运 算 符 ， 而 出 现在 操作 数 
之 前 的 是 前 绥 运 算 符 ， 出 现在 操作 数 之 后 的 则 是 后 绥 运 算 符 。 
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在 第 2 章 中 , 我 们 看 到 两 种 截然 不 同 的 排序 算法 : 选择 排序 和 归并 排序 。 其 实 排序 算法 有 很 
多 种 ， 和 常见 的 情况 是 通 稼 每 一 个 可 以 解决 的 问题 都 可 以 通过 多 种 算法 来 解决 。 

那么 ， 应 该 如 何 选择 解决 给 定 问题 的 算法 呢 ? 一 般 来 说 ， 应 该 选择 易于 理解 、 实 现 和 记录 
的 算法 。 当 性 能 很 重要 时 (〈 它 往往 确实 很 重要 ), 还 需要 选择 能 够 迅速 运行 而 且 能 有 效 使 用 可 用 
计算 资源 的 算法 。 因 此 ， 我 们 要 考虑 一 些 很 微妙 的 问题 ， 即 如 何 衡量 程序 或 算法 的 运行 时 间 ，， 
以 及 可 以 采取 哪些 措施 使 程序 运行 得 更 快 。 


3.1 本章 主 要 内 容 


本 章 中 ， 我 们 将 介绍 以 下 主题 。 

D 程序 性 能 的 重要 指标 。 

口 评估 程序 性 能 的 方法 。 

口 大 0 表示 法 。 

D 使 用 大 0 表示 法 估算 程序 的 运行 时 间 。 

D 使 用 递 推 关系 估算 递 归程 序 的 运行 时 间 。 

3.4 人 和 3.5 节 介绍 的 大 0 表示 法 ， 免 去 了 处 理 那些 几乎 不 可 能 确定 的 常量 〈 比 如 第 见 的 C 语 
言 编译 融 在 编译 某 个 给 定 的 源 程 序 时 会 生成 的 机 带 指 令 数 ) 的 麻烦 ， 从 而 简化 了 佑 算 程 序 运行 
时 间 的 过 程 。 

我 们 将 循序 渐进 地 介绍 估算 程序 运行 时 间 所 需 的 技巧 -3.6 闻 和 3.7 方 会 展示 分 析 不 含 函 数 调 
用 的 程序 的 方法 。3.8 将 分 析 具 有 非 递 归 示 数 调用 的 程序 。 接 着 3.9 节 和 3.10 节 会 介绍 如 何 处 理 
递归 冰 数 。 最 后 ，3.11 节 将 讨论 递 推 关 系 的 解决 方案 ， 在 分 析 递 归 胃 数 的 运行 时 间 时 ， 对 这 些 
函数 的 归纳 定义 即 称 为 递 推 关系 。 


3.2 ”算法 的 选择 


如 果 需 要 编写 的 程序 只 是 一 次 性 处 理 少量 数据 后 就 奔 之 不 用 的 ， 就 应 该 选择 自己 所 知 的 最 
容易 实现 的 算法 ， 编 写 并 调试 程序 ， 然 后 就 不 用 多 管 了 。 不 过 ， 如 果 需 要 编写 在 很 长 一 段 时 间 
里 由 很 多 人 使 用 和 维护 的 程序 ， 就 会 出 现 其 他 问题 了 。 其 一 就 是 底层 算法 的 可 理解 性 ， 或 者 说 
是 简单 性 。 要 求 算法 简单 的 原因 有 不 少 ,不 过 最 重要 的 也 许 在 于 ， 与 复杂 的 算法 相 比 ， 简 单 的 
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算法 实现 起 来 不 容易 出 错 。 用 简单 算法 实现 的 程序 ， 哪 怕 在 使 用 相当 长 一 段 时 间 后 ， 遇 到 一 些 
意外 输入 时 曝 出 奇怪 bug 的 可 能 性 也 较 小 。 

应 该 将 程序 写 得 清晰 明确 ， 并 仔细 地 记 下 文档 ， 这 样 可 便于 他 人 维护 这 些 程序 。 如 果 算 法 
简单 上 且 易 于 理解 ， 就 更 易于 摘 述 。 有 了 好 的 文档 ， 原 作者 之 外 的 程序 员 驶 能 方便 地 对 原始 程序 
加 以 修改 (原作 者 经 常 不 会 做 这 些 ) 或 者 , 如 果 程 序 完成 得 比较 早 , 原作 者 也 会 对 其 加 以 修改 。 
有 很 多 程序 员 写 出 巧妙 高 效 的 算法 后 就 从 公司 拍 屁股 走 人 了 ， 结 果 后 续 的 代码 维护 者 只 能 放弃 
他 们 的 算法 ， 转 而 用 更 慢 但 更 好 理解 的 算法 来 代替 ， 这 种 情况 屡见不鲜 。 

当 程序 要 重复 运行 时 ， 它 的 效率 以 及 其 底层 算法 的 效率 就 很 重要 了 。 我 们 通常 会 将 效率 三 
程序 运行 所 花 的 时 间 挂 钩 ， 虽 然 有 时 程序 也 必须 占用 一 些 其 他 资源 ， 比 如 : 

(1) 程序 变量 占用 的 存储 空间 ; 

(2) 程序 在 计算 机 网 络 中 产生 的 流量 ; 

(3) 必须 出 入 磁盘 的 数据 量 。 

不 过 ， 对 大 的 问题 来 说 ， 对 给 定 程序 是 否 堪 用 起 着 决定 性 作用 的 是 运作 时 间 ， 而 本 章 的 主 
题 就 是 运行 时 间 。 我 们 所 要 讲 的 程序 的 效率 ， 其 实 就 是 它 耗 费 的 时 间 ， 是 用 程序 输入 大 小 的 函 
数 来 衡量 的 。 

通常 ， 可 理解 性 和 效率 是 相互 矛盾 的 目标 。 例如， 比较 过 图 2-3 中 的 选择 排序 程序 和 图 2-32 
中 的 归并 排序 程序 的 读者 肯定 都 会 认同 ， 后 者 不 仅 更 长 ， 而 且 难 理解 得 多 。 就 算 我 们 总 结 了 2.2 
节 和 2.8 节 中 给 出 的 那些 解释 ， 在 程序 中 添加 了 经 过 深思 熟 虑 的 注释 ， 结 果 依 然 如 此 。 不 过 ,也 
正如 我 们 将 要 了 解 的 ， 只 要 待 排序 的 元 素 个 数 过 百 ， 归 并 排序 的 效率 就 会 比 选择 排序 的 效率 高 
得 多 。 不 巧 的 是 ， 这 种 情况 太 普 遍 了 一 一 对 大 数据 量 来 说 有 效率 的 算法 ， 编 写 和 理解 起 来 往往 
比 那些 相对 低 效 的 算法 更 加 复杂 。 

算法 的 可 理解 性 ， 或 者 说 是 简单 性 ， 是 有 些 主观 的 概念 。 我 们 可 以 在 某 种 程度 上 克服 算法 
不 够 简单 的 问题 ， 即 在 注释 和 程序 文档 中 对 算法 进行 到 位 的 解释 。 编 写 文 档 的 人 始终 要 考虑 阅 
读 这 些 代码 及 其 注释 的 人 : 一 般 人 能 明白 这 是 在 说 什么 吗 ? 是 否 需 要 进一步 的 解释 、 细 节 、 定 
义 和 示 例 ? 

男 一 方面 , 程序 的 效率 是 个 客观 的 问题 : 程序 所 花 的 时 间 就 是 那么 多 , 没什么 争议 的 余地 。 
不 过 我 们 没 办 法 用 所 有 可 能 的 ( 通常 是 无 数 的 ) 输入 来 运行 程序 。 因 此 ， 我 们 要 对 程序 运行 时 
间 加 以 度量 ， 因 为 它 总 结 了 程序 处 理 所 有 输入 的 性 能 ,通常 是 用 一 个 诸如 “n ”这 样 的 简单 表 
达 式 来 度量 的 。 本 章 下 面 几 节 的 主题 就 是 如 何 度量 程序 的 运行 时 间 。 
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3.3 度量 运行 时 间 

一 旦 我 们 认同 可 以 通过 度量 程序 的 运行 时 间 对 程序 加 以 评估 ， 就 要 面 对 确 定 实际 运行 时 间 
的 问题 。 总 结 运算 时 间 的 两 种 主要 方法 是 : 

(1) 基准 测试 ; 

(C) 分 析 。 

我 们 将 依次 介绍 这 两 种 方法 ， 不 过 本 章 主要 讲 的 还 是 用 于 分 析 程 序 或 算法 的 技术 。 
3.3.1 基准 测试 

在 比较 用 于 完成 相同 任务 的 两 个 或 多 个 程序 时 ， 制 定 一 小 组 可 用 作 基 准 的 典型 输入 是 一 种 
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惯例 。 也 就 是 说 ,我 们 愿意 接受 基准 输入 作为 这 些 任务 组 合 的 代表 ， 并 假设 能 顺利 处 理 基 准 输 
入 的 程序 能 顺利 处 理 所 有 输入 。 

例如 ,评估 排序 算法 的 基准 可 能 包含 一 小 组 数字 ( 比如 圆周 率 的 前 20 位 数字 入 一 个 中 等 规 
模 的 输入 组 ( 比如 得 元 院 斯 州 的 邮政 编码 集合 )， 以 及 一 个 大 规模 输入 组 ( 比如 布鲁克 林 区 电话 
目录 中 的 电话 号 码 集合 )。 我 们 可 能 还 想 知道 ， 在 对 空 集 、 单 元 素 集 以 及 已 排序 表 排序 时 , 程序 
是 否 能 有 效 及 正确 地 工作 。 有 趣 的 是 ， 有 些 排序 算法 在 处 理 已 排序 表 时 的 性 能 惨不忍睹 。” 














90-10 法 则 


与 基准 测试 一 样 ,， 确定 要 分 析 的 程序 在 哪里 花 了 时 间 通 常 也 是 很 实用 的 。 这 种 评估 程序 性 
能 的 方法 称 为 剖析 (profiling )， 而 且 多 数 程序 设计 环境 都 包含 有 剖析 器 (profiler ) 这 种 工具 ， 
会 为 程序 中 每 条 语句 关联 一 个 表示 执行 这 条 语句 所 花 时 间 的 数字 。 还 有 一 种 相关 的 实用 程序 ， 
名 叫 语句 计数 器 ， 用 于 确定 对 于 给 定 的 输入 集 ， 源 程序 中 每 条 语句 执行 的 次 数 。 

很 多 程序 都 具有 这 样 的 特性 ， 即 大 部 分 运行 时 间 都 花 在 一 小 部 分 源 代 码 上 了 。 有 这 么 一 条 
非 正 式 的 法 则 : 90% 的 运行 时 间 花 在 了 10% 的 代码 上 。 尽 管 准确 的 百分比 是 视 程序 而 定 的 ， 不 
过 “90-10 法 则 ”还 是 表明 了 多 数 程序 中 运行 时 间 主 要 花 在 了 哪里 。 想 要 加 快 程序 运行 速度 ， 最 
简单 的 一 种 方法 就 是 对 程序 加 以 剖析 ， 并 对 程序 “热点 ”( 也 就 是 程序 中 花 掉 大 部 分 运行 时 间 
的 部 分 ) 的 代码 加 以 改进 。 例 如 ， 我 们 在 第 2 章 中 提 到 过 ， 用 等 价 的 和 迭代 函数 替代 递归 函数 是 
可 能 为 程序 提速 的 。 不 过 , 这 种 做 法 只 有 在 递归 函数 正好 是 程序 中 占用 大 部 分 运行 时 间 的 部 分 
时 才 奏 效 。 

在 极端 情况 下 ， 即 便 我 们 将 只 占用 10% 时 间 的 那 90% 的 代码 所 花 的 时 间 变 为 0， 程 序 总 的 
运行 时 间 也 只 减少 了 10%。 然 而 ， 如 果 将 10% 的 程序 所 占用 的 那 90% 的 时 间 减 半 ， 总 运行 时 间 
就 将 减少 45%。 





3.3.2 ”对 程序 的 分 析 


要 分 析 程 序 ， 首先 要 按 大 小 为 输入 分 组 。 正 如 在 2.9 市 中 与 证 明 递归 程序 属性 一 起 讨论 的 那 
样 ， 用 来 表示 输入 大 小 的 度量 是 因 程序 而 异 的 。 对 排序 程序 来 说 ， 竺 排序 元 素 的 数量 就 是 个 很 
不 错 的 度量 。 对 于 求解 n 元 线性 方程 组 的 程序 ， 拿 n 作 为 问题 的 大 小 是 很 平常 的 。 其 他 的 程序 可 
能 使 用 某 个 特定 输入 的 值 作为 程序 输入 的 表 的 长 度 ， 或 作为 输入 的 数组 的 大 小 ， 或 是 诸如 此 类 
的 度量 的 组 合 。 

3.3.3 ”运行 时 间 

用 函数 7(o) 来 表示 程序 或 算法 处 理 大 小 为 n 的 任意 输入 所 花 的 时 间 是 很 方便 的 。 我 们 将 
7T(n) 称 为 程序 的 运行 时 间 。 例 如 ， 某 个 程序 的 运行 时 间 可 能 是 7(n) = cn， 其 中 c 是 某 个 常数 。 
换个 说 法 就 是 ， 该 程序 的 运行 时 间 ， 与 其 要 处 理 的 输入 的 大 小 是 线性 相关 的 。 这 样 的 程序 或 算 
法 就 是 线性 时 间 的 ， 或 者 直接 说 成 是 线性 的 。 








(D 选择 排序 和 归并 排序 都 不 在 此 列 ， 它 们 在 处 理 有 序列 表 时 所 花 的 时 间 几 乎 与 为 相同 长 度 的 任 一 列表 排序 所 花 的 
时 间 相 同 。 
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我 们 可 以 将 运行 时 间 7(n) 看 作 程 序 执行 的 C 语 言语 句 的 数量 ， 或 是 在 某 标 准 计算 机 上 运行 
程序 所 花 的 时 长 。 在 多 数 情况 下 ， 我 们 都 不 会 明确 指出 7(n) 的 具体 单位 。 事 实 上 ， 正 如 我 们 在 
下 一 节 中 将 要 看 到 的 ， 在 谈论 程序 的 运行 时 间 时 ， 可 以 只 用 某 个 (未知 的 ) 常数 因子 乘 上 7T(n) 
来 表示 。 

很 多 时 候 ， 程 序 的 运行 时 间 取 决 于 某 个 特定 的 输入 ， 而 不 仅仅 取决 于 输入 的 大 小 。 在 这 类 
情况 下 ， 我 们 将 7T(n) 定义 为 最 坏 情况 运行 时 间 ， 也 就 是 所 有 大 小 为 n 的 输入 所 能 造成 的 最 大 运 
行 时 间 。 

男 一 种 常见 的 性 能 度量 是 7,,(n), 即 程序 处 理 所 有 大 小 为 的 输入 的 平均 运行 时 间 。 平均 运 
行 时 间 有 时 候 是 对 实际 性 能 更 为 现实 的 反映 , 不 过 它 往 往 比 最 坏 情 况 运 行 时 间 更 难 计算 。“ 平 均 
运行 时 间 ” 中 “平均 的 概念 还 意味 着 ， 所 有 大 小 为 n 的 输入 是 等 可 能 性 的 ， 而 这 在 某 个 给 定 情况 
下 既 可 能 为 真 ， 也 可 能 不 为 真 。 
































+ 示例 3.1 

让 我 们 估算 一 下 图 3-1 中 所 示 的 SelectionSort 程 序 段 的 运行 时 间 。 这 些 语句 的 编号 与 图 
2-2 中 的 编号 如 出 一 氏 。 这 段 代 码 的 目的 是 要 将 数组 A 从 A[i] 到 A[n-i] 这 部 分 中 最 小 元 素 的 下 
标 赋值 给 sma11。 








small = i; 
for(j = i+1; j < n; j++) 


if (A[j] < A[small]) 
small = j; 





图 3-1 选择 排序 的 内 层 循环 


一 开始 , 我 们 需要 对 时 间 单 位 加 以 简单 定义 。 后 面 我 们 会 详细 介绍 这 一 问题 , 不 过 在 这 里 ， 
以 下 简单 模式 是 有 效 的 。 可 以 将 每 次 执行 赋值 语句 记 作 一 个 时 间 单 位 。 在 第 (3) 行 ， 要 为 for 循 
环 开 头 j 的 初始 化 记 上 一 个 时 间 单 位 , 为 测试 是 否 有 j=<n 记 上 一 个 单位 , 并 为 减少 j 记 上 一 个 单 
位 ， 每 次 循环 丝 是 如 此 。 最 后 ， 每 执行 一 次 第 (4) 行 的 测试 ， 就 要 记 上 一 个 单位 。 

首先 , 让 我 们 考虑 一 下 内 层 循环 的 循环 体 : 第 (4) 行 和 第 (5) 行 。 第 (4) 行 的 测试 总 是 要 执行 的 ， 
不 过 第 (5) 行 的 赋值 只 有 在 测试 成 功 的 情况 下 才 执 行 。 因 此 ， 该 循环 体会 消耗 1 到 2 个 时 间 单 位 ， 
这 取决 于 数组 A 中 的 数据 。 如 果 要 采纳 最 坏 情况 ,就 可 以 假设 循环 体 要 消耗 2 个 时 间 单 位 。 我 们 
会 进行 n-i-1 次 for 循 环 , 而 每 进行 一 次 循环 都 要 执行 一 过 循环 体 (2 个 时 间 单 位 ), 接着 递增 j 
并 测试 j=n〔 又 是 2 个 时 间 单 位 )。 因 此 ， 进 行 循环 所 花 的 时 间 单 位 是 4(n -i-1) 。 除 了 这 个 数 
字 之 外 ， 我 们 还 要 加 上 第 (2) 行 初始 化 small 的 1 个 时 间 单 位 ， 第 (3) 行 初始 化 j 的 1 个 时 间 单 位 ， 
以 及 在 第 (3) 行 第 一 次 测试 j=<n 的 1 个 时 间 单 位 ( 这 与 循环 的 任 一 次 迭代 的 终止 无 关 ),。 因此 , 图 
3-1 中 的 程序 段 的 总 运行 时 间 为 4(n 一 7)-1。 

将 图 3-1 所 影响 数据 的 “大 小 ”m 指 定 为 m=n-i 是 很 自然 的 ， 因 为 这 是 它 所 影响 的 数组 
A[i..n-1] 的 长 度 ,那么 运行 时 间 4(n 一 让 -1 就 可 以 表示 为 4m 一 1 ,因此 ,图 3-1 的 运行 时 间 7(m) 


就 是 4m 一 1 oO 
3.3.4 不 同 运行 时 间 的 比较 
假设 对 某 个 问题 ,可 以 选择 使 用 运行 时 间 为 7,(n) =100n 的 线性 时 间 程 序 A， 以 及 运行 时 间 
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为 7,(n)=2n 的 二 次 震 时 间 程 序 B。 假 设 这 两 个 运行 时 间 是 在 同一 特定 计算 机 上 处 理 大 小 为 z 的 
输入 所 花 的 毫秒 数 。" 运 行 时 间 图 见 图 3-2。 





20 000 


15 000 7 一 272 


T(n) 10 000 


3 000 





0 20 40 60 80 100 
输入 大 小 为 n 
图 3-2 ”线性 程序 与 二 次 究 程 序 的 运行 时 间 


从 图 3-2 可 知 ， 对 大 小 小 于 50 的 输入 来 说 ， 程 序 B 要 比 程序 A 快 。 当 输入 的 大 小 大 于 50 时 ， 
程序 A 就 要 更 快 了 ， 而 且 从 50 这 个 临界 点 开始 ， 输 入 越 大 ， 程 序 A 相 比 程序 B 而 言 优势 就 越 大 。 
对 大 小 为 100 的 输入 ，A 要 比 B 快 上 2 倍 ， 而 对 大 小 为 1000 的 输入 ，A 要 快 上 20 倍 。 

程序 运行 时 间 的 函数 形式 最 终 确定 了 我 们 能 用 该 程序 解决 多 大 的 问题 。 随 着 计算 机 速度 的 
不 断 变 快 ， 与 运行 时 间 增 长 迅速 的 程序 相 比 ， 那 些 运行 时 间 增 长 缓慢 的 程序 在 可 处 理 问 题 的 规 
模 上 能 取得 更 大 的 提高 。 

再 次 假设 图 3-2 所 示 的 程序 运行 时 间 是 以 毫秒 计 的 ， 图 3-3 中 的 表格 表示 了 在 同一 台 计 算 机 
上 ， 花 同样 的 时 间 ， 使 用 两 种 程序 分 别 能 解决 多 大 的 问题 。 例 如 ， 假 设 可 以 接受 100 秒 的 计算 
时 间 。 如 果 计 算 机 的 速度 加 快 10 倍 ， 那 么 在 100 秒 内 能 处 理 之 前 需要 花 1000 秒 去 处 理 的 问题 。 
对 算法 A 来 说 , 我们 现在 可 以 解决 10 倍 大 小 的 问题 ， 而 对 算法 B 来 说 ， 只 可 以 解决 3 倍 大 小 的 问 
题 。 因 此 ， 随 着 计算 机 速度 的 持续 加 快 , 通过 使 用 低 增长 率 的 算法 和 程序 可 以 获得 更 为 显著 的 
优势 。 

















时 间 〈 秘 ) 使 用 程序 A 可 解决 的 最 大 问题 的 大 小 使 用 程序 A 可 解决 的 最 小 问题 的 大 小 











图 3-3 ”在 可 用 时 间 段 函数 可 解决 问题 的 大 小 


Q 这 里 A 和 B 的 关系 ， 与 归并 排序 和 选择 排序 的 关系 没有 太 多 不 同 。 我 们 在 3.10 节 中 将 会 看 到 ， 归 并 排序 的 运行 时 
间 是 以 nlogn 的 速度 增长 的 。 
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别 在 乎 算法 的 效率 ， 再 等 上 几 年 就 行 了 


大 家 可 能 经 常 听 到 这 样 的 说 法 、 不 需要 缩短 算法 的 运行 时 间或 是 选择 更 高 效 的 算法 ， 因 为 
计算 机 的 速度 每 隔 几 年 就 会 翻番 ,而 且 不 需要 多 久 ， 任何 算法 ,不管 有 多 低 效 ， 所 花 的 时 间 都 
会 少 到 没有 人 在 意 了 ,这 一 论调 的 出 现 已 经 有 几 十 年 的 时 间 了 ,但 计算 资源 需求 上 限 尚 未 出 现 ， 
因此 ， 我 们 一 般 都 不 接受 硬件 改善 可 以 让 高 效 算 法 的 研究 变 成 无 用 功 这 种 观点 。 

不 过 ,也 存在 我 们 不 需要 过 分 考虑 效率 的 情况 。 例 如 ， 某 所 学 校 在 每 学 期 期 末 都 要 将 存储 
在 某 台 计算 机 中 的 学 生 电子 成 绩 表 打 印 成 纸 质 成 绩 单 。 该 操作 所 花 的 时 间 大 概 与 要 报告 的 成 绩 
数量 成 线性 关系 ， 就 像 假 想 算 法 4 那样 。 如 果 学 校 更 换 了 一 台 速 度 快 上 10 倍 的 计算 机 ， 完 成 这 
项 工作 所 花 的 时 间 就 会 变 为 原来 的 十 分 之 一 。 不 过 ， 学 校 因此 要 扩招 10 倍 ， 或 是 要 求 每 个 学 生 
增加 10 倍 的 课程 ， 这 是 很 不 现实 的 。 计 算 机 的 提速 不 会 影响 到 成 绩 单程 序 的 输入 大 小 ， 因 为 这 
一 大 小 是 受 其 他 因素 限制 的 。 

另 一 方面 ， 还 会 存在 另外 一 些 问 题 ， 我 们 凭借 新 兴 的 计算 资源 有 了 一 些 解决 的 头绪 ， 不 过 
它们 的 “大 小 ”" 却 超出 了 现 有 技术 的 处 理 能 力 。 这 样 的 问题 包括 自然 语言 的 理解 、 计 算 机 视觉 
( 对 数字 化 图 像 的 理解 )， 以 及 各 种 对 人 机 “智能 ”交互 的 尝试 。 不 管 是 通过 改善 算法 还 是 通过 
提升 机 器 性 能 ， 所 获得 的 加 速 都 将 提升 我 们 在 接 下 来 几 年 里 处 理 这 些 问题 的 能 力 。 此 外 ， 当 它 
们 变 成 “简单 ”的 问题 后 ， 我 们 现在 很 难 想象 的 新 一 代 挑 战 又 会 替代 它们 摆 在 计算 机 面前 。 





3.3.5 “习题 
(1) 考虑 一 下 图 2-13 中 的 阶乘 程序 段 , 设 输入 大 小 为 读 取 的 n 的 值 。 每 次 执行 赋值 、 读 和 写 语句 记 为 一 
个 时 间 单 位 ， 每 进行 一 次 while 循 环 条 件 测试 记 为 一 个 时 间 单 位 ， 计 算 该 程序 的 运行 时 间 。 
(2) 为 2.5 闻 习题 (1) 以 及 图 2-14 中 的 程序 段 给 出 恰当 的 输入 大 小 。 运 用 上 一 题 中 的 计数 规则 ,确定 这 两 


个 程序 的 运行 时 间 。 
(3) 假设 程序 A 花 费 2” /1000 个 时 间 单 位 ， 程 序 B 花 费 10007 个 时 间 单 位 。 对 哪些 zx 值 来 说 ， 程 序 A 花 
的 时 间 比 程序 B 少 ? 


(4) 对 上 一 题 中 的 两 个 程序 ， 在 10° 个 、10? 个 和 102 个 时 间 单 位 内 能 解决 的 问题 各 有 多 大 ? 
(5) 假设 程序 A 花 费 1000z 个 时 间 单 位 ， 程 序 B 花 费 nn 个 时 间 单 位 ， 重复 习题 (3) 和 习题 (4) 中 的 练习 。 


3.4 大 O 运行 时 间 和 近似 运行 时 间 


假设 我 们 编写 了 一 个 C 语 言 程 序 ， 并 选择 了 想 要 它 处 理 的 特定 输入 。 程 序 处 理 这 一 输入 的 
运行 时 间 仍 取决 于 以 下 两 个 因素 。 

(1) 运行 该 程序 的 计算 机 。 一 些 计算 机 执行 指令 的 速度 比 其 他 计算 机 更 快 , 最 快 的 超级 计算 
机 与 最 慢 的 个 人 计算 机 之 间 的 性 能 比 远 大 于 1000 : 1。 

(2) 生成 计算 机 可 执行 程序 所 使 用 的 特定 C 语 言 编 译 颖 。 在 同一 计算 机 上 ， 执 行 不 同 程 序 所 
用 的 时 间 是 不 一 样 的 ， 即 便 这 些 程序 有 着 相同 的 功效 。 

这 样 一 来 ,我 们 就 不 能 看 着 C 语 言 程序 及 其 输入 ， 然 后 判断 说 :“ 这 个 任务 要 人 花 上 3.21 秒 。” 
除非 知道 用 的 什么 计算 机 和 编译 器 。 此 外 ， 就 算 我 们 知道 程序 、 输 入 、 机 器 和 编译 占 ， 要 准确 
预计 将 要 执行 的 机 器 指令 数 通常 也 是 一 项 过 于 复杂 的 任务 。 
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出 于 这 些 原因 ， 我 们 通常 用 大 0 表示 法 来 表示 程序 的 运行 时 间 ， 该 方法 让 我 们 可 以 不 去 考 
虑 如 下 常数 因子 。 

(1) 特定 编译 絮 生 成 机 秦 指 令 的 平均 数 。 

(2) 特定 计算 机 每 秒 执行 机 器 指令 的 平均 数 。 

例如 ， 就 像 在 示例 3.1 中 那样 ， 我 们 研究 的 SelectionSort 程 序 段 处 理 长 度 为 m 的 数组 将 
耗 时 4m 一 1。 不 过 这 里 我 们 不 这 么 说 , 而 是 说 它 耗 时 O(m) , 非 正 式 的 含义 是 “ 某 个 常数 乘 以 m”。 

“ 某 个 常数 乘 以 m” 这 一 表述 不 仅 能 让 我 们 忽略 那些 与 编译 右 和 计算 机 相关 的 未 知 和 常数， 还 
让 我 们 可 以 作出 一 些 起 简化 作用 的 假设 。 例 如 ， 在 示例 3.1 中 ,假设 所 有 的 赋值 语句 会 消耗 长 短 
相同 的 一 段 时 间 ， 而 在 测试 for 循 环 的 终止 、 随 着 循环 进行 递增 j ， 以 及 进行 变量 初始 化 等 工作 
时 ， 也 都 会 消耗 这 样 长 的 一 段 时 间 。 因 为 这 些 假设 在 实际 情况 中 都 是 不 可 能 的 ， 所 以 在 运行 时 
间 方 程 T(m)= 4w -1 中 ， 常 数 4 和 -1 是 对 事实 的 最 佳 通 近 。 可 以 更 近似 地 将 7T(o 描述 为 “ 某 个 
党 数 乘 以 放 ， 再 加 上 或 减 去 某 个 常数 ”， 甚 至 描述 为 “最 多 与 m 成 正比 "。 O(m) 表示 法 使 我 们 可 
以 在 不 涉及 不 可 知 或 无 意义 常数 的 情况 下 作出 这 些 陈 述 。 

男 一 方面 ， 将 程序 段 的 运行 时 间 表 示 为 O(m) ， 也 告诉 我 们 一 些 非 常 重要 的 事情 。 它 表明 ， 
执行 处 理 逐 步 变 大 的 数组 的 程序 ， 所 花 的 时 间 是 线性 增长 的 ， 就 像 3.3 节 末尾 的 图 3-2 和 图 3-3 中 
假想 的 程序 A 那 样 。 因 此 ， 该 程序 段 表示 的 算法 ， 优 于 运行 时 间 增 长 更 快 的 算法 〈 比 如 在 上 文 
的 讨论 中 与 程序 A 相 对 比 的 假想 程序 B )。 

3.4.1 大 O 的 定义 

我 们 现在 要 给 出 某 个 函数 是 男 一 个 函数 的 “大 O” 的 正式 定义 。 设 有 卫 数 7(n) ， 这 通常 是 
某 个 程序 的 运行 时 间 ， 以 输入 大 小 为 n 的 函数 来 度量 。 要 让 兄 数 适用 于 度量 程序 的 运行 时 间 ,， 我 
们 假设 有 : 

(1) 参数 n 被 限定 为 非 负 整 数 ; 

(2) 值 T(n) 对 所 有 的 参数 n 来 说 都 非 负 。 

设 f(n) 是 某 个 定义 在 非 负 整数 n 之 上 的 函数 。 如 果 除 了 对 某 些 较 小 的 n 值 之 外 ，7T(n) 至 多 是 
某 个 常数 乘 以 f(n) ， 我 们 就 可 以 说 

T(n) 是 O(f(n)) 要 

正式 地 说 ， 如 果 存 在 某 个 整数 n 以 及 某 个 大 于 0 的 常数 c<， 使 得 对 所 有 大 于 的 整数 上 ， 都 
有 Tn) 三 cf(n) ， 那 么 我 们 就 说 7T(n) 是 O(f(n))。 

我 们 把 数 对 n。 和 c 称 为 “7(n) 是 O(f(m)” 这 一 事实 的 证 物 (witness ), 在 接 下 来 的 证 明 中 ， 
该 证 物 可 以 为 7(n) 和 f(n) 的 大 0 关系 “作证 ”。 


3.4.2 ”证明 大 O 天 系 


可 以 应 用 “大 O” 的 定义 证 明 对 特定 的 函数 T 和 f，7T(n) 就 是 O(f(n)) 。 我 们 会 通过 选择 特 
定 的 证 物 n, 和 c， 接着 证 明 7T(n) 入 cf (n) ， 从 而 完成 这 一 证 明 。 证明 过 程 必须 假设 n 是 非 负 整数 ， 
且 不 小 于 我 们 选择 的 mm 。 通 常 ， 证 明 过 程 涉及 一 些 代数 和 不 等 式 的 变换 。 


+ 示例 3.2 
假设 有 某 个 程序 ， 其 运行 时 间 为 7(0) =1，7(D = 4 ，7(2)=9，, 一 般 表示 为 T(n) = (n+1)?。 
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我 们 就 可 以 说 7T(n) 是 O(n”) ， 或 者 说 7T(n) 是 二 次 寡 的 ， 因 为 可 以 选择 证 物 mm =1 和 c=4。 然 后 
需要 证 明 (n+1) 三 4n”, 其 中 有 nn 三 1。 在 证 明 过 程 中 , 我 们 将 表达 式 (n+1) 展开 为 n* +2n+1。 
只 要 nn 宇 1， 我 们 就 知道 有 nn 三 nw 而且 有 1 三 n*。 因 此 
n+2n+l1 n+2n’ +n’ = 4n’ 

此 外 ， 也 可 以 选择 证 物 n, =3 和 c=2， 因 为 ,正如 大 家 可 以 验证 的 ， 对 所 有 的 n 三 3， 都 
有 (n+l)’ 2n?。 

不 过 , 不 能 选择 n =0， 因 为 车 n, =0,， 那么 对 n=0, 我 们 可 以 证 明 (0+])? 三 c0  ， 也 就 是 
有 1 小 于 等 于 c 乘 以 0。 因 为 不 管 选 择 什 么 <， 都 有 cx0=0， 而 1 三 0 是 不 成 立 的 ， 所 以 如 果 我 们 
选择 由 = 0 就 玩 完了 。 不 过 没关系 ,因为 要 证 明 (n+1)? 是 O(n*), 所 以 只 要 找 出 一 组 可 行 的 证 物 
n, 和 c 就 行 了 。 





大 O 证 明 的 模版 
请 记 住 : 所 有 的 大 0 证 明基 本 遵循 相同 的 形式 ， 只 有 代数 变换 是 各 异 的 。 要 证 明 7T(z) 就 是 
O(f(n)) ， 要 做 的 只 有 下 面 两 件 事 。 
(1) 说 明证 物 n, 和 c。 这 些 证 物 必 须 是 特定 的 常数 ， 比 如 而 =47 和 c=12.5 。 还 有 ，710 必须 
是 非 负 整 数 ， 而 c 必 须 是 正 实 数 。 
(2) 通过 适当 的 代数 变换 ,证 明 对 所 选择 的 特定 证 物 n 和 c， 如 果 n 宇 n,。， 则 有 
T(n) < cf (CD 。 





这 可 能 看 起 来 有 些 奇怪 ,虽然 (n+1) 大 于 n*, 但 是 我 们 还 是 说 (n+1) 是 O(n*) 。 其 实 , 也 
可 以 说 (n+1)? 是 任意 分 之 zr 的 大 O， 例如 O(n?/100) 。 要 看 看 原因 的 话 ， 选 择 证 物 n,=1 和 
c= 400 。 那 么 如 果 n 宇 1， 由 与 示例 3.2 中 一 样 的 推 必 可知 
(n+1) < 400(n? /100) = 4n? 





这 些 现象 背后 的 基本 原则 如 下 。 

(1) 常数 因子 不 产生 影响 。 对 于 任意 正 值 常数 4 和 任意 函数 Ta) ，7T(n) 是 O(47T(n)) ， 不 论 4 
是 很 大 的 数 , 还 是 很 小 的 分 数 ， 只 要 4d>0 即 可 。 要 知道 为 什么 , 可 以 选择 证 物 n =0 和 c=1/4d 。 
“那么 就 有 7(n) 三 c(47T(n)) ， 因 为 cd =1。 类 似 地 ， 关 已 知 7T(n) 是 0O(f(n)) ， 便 也 知道 对 任何 
的 4>0， 有 7T(n) 是 O(4df(n)) ， 即 便 4 很 小 。 因 为 我 们 知道 ， 对 某 个 常数 cl, 和 所 有 的 n 三 n, ， 有 
T(n) 三 cf(n)。 如 果 选 择 c=c /qd ， 那 么 就 可 以 看 到 ,对 n 宇 n, ， 有 T(n) 夸 c(4df(n))。 

(2) 低 阶 项 不 产生 影响 。 假设 T(n) 是 形 如 

an +a Nn ++an +antao 
的 多 项 式 ， 其 中 开头 的 系数 w 为 正 数 。 然 后 我 们 可 以 扔 掉 除 第 一 项 〈 就 是 具有 最 高 指数 /的 那 
项 ) 之 外 的 所 有 项 , 并 利用 规则 (1), 忽略 常数 a,, 直接 用 1 代替 它 。 也 就 是 说 , 我 们 可 以 得 出 7T(n) 
就 是 Ow” ) 。 为 了 证 明 这 一 点 ， 设 四 =l ， 并 设 c 是 各 系数 a 中 所 有 正 系 数 的 和 ， 其 中 0 志 i 二 。 
如 果 系数 a 是 0 或 负数 ,那么 肯定 有 ajn’ 三 0 。 如 果 a 为 正 ， 那 么 对 所 有 的 j<k ， 只 要 n 宇 1， 


J 请 注意 ,虽然 要 求 选择 常数 而 不 是 函数 作为 证 物 ， 但 选择 c=1/4 是 没有 错 的 ， 因 为 4 本 身 也 是 个 常数 。 
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都 有 ajn’ 三 arn 。 因 此 7(n) 不 大 于 n" 乘 以 所 有 正 系数 之 和 ， 或 者 说 是 T(n) 入 cm 。 





关于 大 OO 的 庄 论 
对 “大 O” 的 定义 是 很 诡异 的 ， 在 该 定义 中 ,在 检查 完 T(n) 和 wo) 后 ， 我 们 要 一 次 性 选择 
证 物 n 和 c, 接着 证 明 对 所 有 的 n 宇 n, ,都 有 7T(n) 三 cf(n) 。 不 能 为 每 个 n 值 重新 选择 c 和 (或 )n。 
例如 ， 大 家 可 能 偶尔 会 看 到 如 下 证 明 n 为 O(n) 的 廖 误 “证 明 ”。“ 选 择 n, =0 ， 并 为 每 个 n 选 择 
c=n。 然 后 有 n? 三 cn 。 这 种 论述 是 无 效 的 ， 因 为 我 们 要 求 在 不 知道 hn 的 情况 下 一 次 性 选 定 c。 





+ 示例 3.3 

作为 规则 () (“常数 因子 不 产生 影响 ”) 的 例子 ， 我 们 看 到 2n 是 O(0.001n)。 令 n,=0， 而 
且 c=2/0.001= 2000。 那 么 显然 有 ， 对 所 有 的 n 宇 0，2n* 2000(0.001n )=2n。 

作为 规则 (2)(“ 低 阶 项 不 产生 影响 ”) 的 例子 ， 考 虑 多 项 式 T(n)=3n’s +10n* 一 4n +n+l。 
最 高 位 的 项 是 n ， 我 们 就 说 Ta) 是 O(n ) 。 要 验证 该 说 法 , 令 n,=1，c 等 于 所 有 正 系数 的 和 。 
正 系 数 的 项 包含 指数 为 5、4、1 和 0 的 这 些 项 ， 其 系数 分 别 为 3、10、1 和 1。 因 此 , 令 c=15。 我 
们 可 以 说 ， 对 n 宇 1， 有 

3155 +10n -4n +nt+l3n +10n +n +n’ =15n’ (3.1) 

我 们 可 以 通过 对 正 系 数 项 的 匹配 来 验证 不 等 式 (3.1)， 也 就 是 ，3n° 3n” ，10n“ 夺 10n’， 
n 三 nw ,以 及 1 三 nn 。 而 且 ， 因为 -4n 三 0 (之 前 假设 n 为 正 数 )， 所 以 可 以 忽略 不 等 式 (3.1) 左 
边 的 负 系 数 项 。 因此 , 不等式 (3.1) 的 左边 , 也 就 是 7(n) , 要 小 于 等 于 不 等 式 的 右边 , 也 就 是 15n ， 
或 者 说 是 cm 。 由 此 可 以 得 出 7T(n) 是 O(n’) 的 结论 。 

其 实 , 低 阶 项 可 以 删除 的 原则 不 仅 适用 于 多 项 式 , 而 且 适 用 于 任何 表达 式 之 和 。 也 就 是 说 ， 
如 果 随 着 n 趋 近 无 穷 大 ，h(n) /g(n) 的 比值 趋 近 于 0， 则 可 以 说 h(n) 比 g(n)“ 增 长 得 慢 ", 或 者 说 
h(n) 的 “增长 率 低 于 ”g(n) ， 这 样 就 可 以 忽略 hn) 。 也 就 是 说 h(n)+g(n) 是 0(g(n))。 

例如 ， 设 7T(n)=2” ”+n 。 众 所 周知 ， 多 项 式 ( 比如 n  ) 要 比 指数 式 ( 比如 2”) 增长 得 慢 。 
为 随 着 n 的 增 大 ，n? /2” 趋 近 于 0， 所 以 我 们 可 以 扔 掉 低 阶 项 ， 并 得 出 7T(n) 是 0(2”) 的 结论 。 

要 正式 地 证 明 2”+mw 是 0(2"), 令 n=10，c=2。 必 须 证 明 , 对 nn 三 10， 有 

2"+n’ S22x2" 

如 果 从 两 边 都 减 去 2" ， 就 会 发 现 这 是 要 证 明 对 n 三 10 ， 有 nn 三 2”。 

对 n=10 ,我们 有 2"=1024。 而 10; =1000 ， 因 此 对 n=10， 有 ww 三 2”。n 每 增加 1，2” 就 
会 翻 倍 ， 而 nw 则 是 会 乘 以 (n+1) /ni 这 个 量 ， 而 当 n 宇 10 时 ， 这 个 量 是 小 于 2 的 。 因 此 ， 随 着 n 
的 增 大 , nw 会 逐步 小 于 2"。 我 们 可 以 得 出 结论 : 对 n 宇 10 , 有 ww 三 2”, 因此 有 2”+n 是 0(2”)。 
3.4.3 ”证 明 大 OO 关系 不 成 立 

如 果 两 个 函数 之 间 的 大 0 关系 成 立 ,， 就 可 以 通过 找 出 证 物 来 证 明 这 种 关系 。 然 而 ,如 果 某 
个 函数 7T(n) 不 是 男 一 个 函数 f(n) 的 大 O 呢 ?答案 就 是 ， 经 常 可 以 证 明 某 个 特定 的 函数 7(n) 不 
是 O(f(m)) 。 证 明 方 法 是 , 假设 证 物 n, 和 c 存 在 ， 并 推理 出 矛盾 。 下 面 要 介绍 这 种 证 明 的 一 个 
例子 。 
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+ 示例 3.4 

在 前 文 附注 栏 “ 关 于 大 O 的 廖 论 ”中 ， 我 们 声称 x 不 是 O(n) 。 我 们 可 以 证 明 该 声明 ， 方 法 
如 下 。 假设 w 是 O(n) ， 然 后 就 存在 证 物 n, 和 c， 使 得 对 所 有 的 n 三 n, ， 都 有 n 三 cn。 不 过 如 
果 我 们 选择 n 等 于 2c 和 nn 中 较 大 者 ， 就 会 有 不 等 式 

(nn) < on (3.2) 

一 定 成 立 ( 因为 n 三 n,， 而 且 对 所 有 的 nn 三 n, ，n? 三 cn 都 是 成 立 的 )。 

如 果 将 不 等 式 (3.2) 两 边 都 除 以 n ， 就 有 nn 三 c 。 然 而 ,我们 还 选择 了 n 至 少 是 2c。 因 为 证 
物 c 一 定 为 正 数 ， 所 以 ni 不 可 能 既 小 于 c 又 大 于 2c。 因 此 ， 可 以 证 明 “w 是 On)” 的 证 物 n, 和 ec 
不 存在 ， 由 此 可 以 得 出 结论 : nn’ 不 是 O(n) 。 


3.4.4 “习题 


(1) 考虑 以 下 4 个 函数 。 
fiin 
bin 
a n 为 奇数 
n,n 为 偶数 
“wn 为 合 数 
对 等 于 1 、2、3、4 的 i , 分 别 确定 f(n) 是 不 是 O(f,n)) 。 要 么 给 出 证 明 大 0 关系 的 mm 和 c 的 值 ， 
要 么 假设 存在 这 样 的 四 和 c， 并 推理 出 矛盾 ,证明 /CD 不 是 O(f,(m)) 。 提 示 : 请 记 住 ， 除 了 2 
之 外 ， 所 有 的 质数 都 是 奇数 。 还 要 记 住 ， 质 数 有 无 数 个 ， 而 合 数 也 有 无 数 个 。 
(2) 有 以 下 一 些 大 0 关系 。 请 为 每 个 大 0 关系 给 出 可 用 来 证 明 这 种 关系 的 证 物 mw 和 c。 选 择 最 小 的 一 组 
证 物 ， 也 就 是 说 略 -1 和 c 不 是 证 物 ， 而 如 果 dg<c ， 那 么 四 和 qd 也 不 是 证 物 。 
(a) 六 是 O(0.0012) 。 
(b) 25n* -1913 +13n? 一 106n+77 是 O(n)。 
(Oo Fn+10 是 O(2”) 
(d) 是 0O(3")。 
(e)* log,n 是 O(Vn)。 
(3)* 证 明 : 如 果 对 所 有 的 x 有 f(n)<g(n) ,那么 f (n+tg(n) 是 0O(g(n))。 
(4)** 假 设 f(n) 是 O(g(n)) ,而且 g(n) 是 O(f(n))。 那 么 f(n) 和 g(n) 之 间 有 什么 关系 ? 是 不 是 一 定 
有 f(n)=g(n)? 随 着 n 趋 近 无 穷 大 ，f(n)/g(n) 的 极限 是 否 一 定 存 在 ? 











证 明 大 O 关 系 不 成 立 的 模板 
证 明 函 数 7(n) 不 是 O(f(n)) 的 常见 证 明 过 程 如 下 。 示 例 3.4 就 展示 了 这 样 的 证 明 过 程 。 
(1) 首先 假设 存在 证 物 n, 和 c， 使 得 对 所 有 的 n 宇 n,， 都 有 f(n) 三 cg(n) 。 这 里 ，n, 和 c 是 表示 未 知 
证 物 的 符号 。 
(2) 定义 特定 的 整数 n ， 用 与 n, 和 c 相 关 的 形式 表示 (例如 ， 在 示例 3.4 中 ， 我 们 选择 的 是 
1 = max(71,2c) ) 。 该 是 用 来 证 明 T(n) 三 cf(n) 的 1 的 值 。 
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(3) 证明， 对 于 这 个 选 定 的 n ， 有 nn 宇 n,。 这 一 部 分 是 非常 简单 的 ， 因 为 我 们 在 第 (2) 步 中 选择 的 
至 少 是 nn。 

(4) 声明 因为 有 nn 宇 n, ， 所 以 一 定 有 Tln) 志 cf(n)。 

(5) 通过 证 明 对 我 们 选择 的 这 个 nn 有 Tln) 之 cf (m) ， 从 而 推导 出 矛盾 。 选 择 与 [有关 的 4 可 以 让 这 个 
部 分 变 得 很 简单 ， 就 像 示例 3.4 中 所 做 的 那样 。 





3.5 简化 大 O 表达 式 


正如 我 们 在 3.4 节 中 看 到 的 ， 通 过 舍弃 一 些 常数 因子 和 低 阶 项 ， 可 以 简化 大 0 表达 式 。 我 们 
将 会 看 到 ， 在 分 析 程 序 时 ， 作 出 这 样 的 简化 有 多 重要 。 一 般 来 说 ， 某 个 程序 的 运行 时 间 来 源 于 
程序 中 很 多 不 同 的 语句 或 程序 段 ， 而 一 小 部 分 程序 占用 大 量 运 行 时 间 的 情况 也 很 平常 (由 
“90-10” 法 则 可 知 ) 通过 舍弃 一 些 低 阶 项 ， 并 将 相等 或 近似 相等 的 项 结合 起 来 , 通常 能 大 大 人 简 
化 表示 运行 时 间 的 大 0 表达 式 。 


3.5.1 大 O 表 达 式 的 传递 律 


首先 ， 我 们 要 拿 出 考虑 大 O 表 达 式 时 的 一 个 实用 规则 。 诸 如 < 这样 的 关系 ， 就 被 称 为 传递 
的 ， 因 为 它 遵 循 “ 若 4 三 B, 且 BC， 则 4 三 C” 这 样 的 法 则 。 例 如， 因为 3 三 5，5 三 10， 
所 以 我 们 可 以 确定 3 三 10。 

而 “是 /的 大 0” 这 样 的 关系 是 另 一 种 具有 传递 性 的 关系 。 也 就 是 说 , 如 果 f(n) 是 0O(g(n))， 
而 且 g(m) 是 O(h(n))， 就 有 f(n) 是 O(h(n))。 要 知道 原因 ， 首 先 假设 f(n) 是 0O(g(n))。 那 么 存 
在 证 物 n 和 c,， 使 得 对 所 有 的 nn 三 n ， 都 有 f(n) 三 cg(n)。 类 似 地 ， 如 果 g(n) 是 0O(h(n))， 就 
存在 证 物 n, 和 c, ， 使 得 对 所 有 的 n 三 n,， 都 有 g(n) 记 cjh(n)。 























多 项 和 指数 大 OO 表达 式 

多 项 式 的 次 数 是 指 多 项 式 所 有 项 中 的 最 高 指数 。 例如， 示例 3.3 和 示例 3.5 中 提 到 的 多 项 式 
T(n) 的 次 数 为 $5， 因为 其 最 高 阶 项 为 3n” 。 从 我 们 已 经 阐明 的 两 个 原则 ( 常数 因子 不 产生 影响 ， 
以 及 低 阶 项 不 产生 影响 )， 以 及 大 0 表达 式 的 传递 律 ， 可 知 以 下 几 点 。 

(1) 如 果 p(n) 和 g(n) 都 是 多 项 式 , 且 g(n) 的 次 数 大 于 等 于 p(n) 的 次 数 ,就 有 p(n) 是 O(g(n))。 

(2) 如 果 gq(n) 的 次 数 小 于 p(n) 的 次 数 ， 那 么 p(n) 不 是 O(g(n))。 

(3) 指数 式 是 指 形 如 a" 的 表达 式 (其 中 4a>1 )。 指 数 式 要 比 多 项 式 增 长 得 更 快 。 也 就 是 说 ， 
我 们 可 以 为 任 一 多 项 式 p(n) 证 明 ，p(n) 是 O(a")。 例如， 是 O((1.0D”)。 

(4) 反 过 来 ， 对 a>1 ， 不 存在 指数 式 qa” 为 多 项 式 p(n) 的 O(p(n))。 





设 n 是 nn 和 ,二 者 中 的 较 大 值 ， 而且 令 c= cc,。 我 们 声称 no 和 c 为 “f(n) 是 O(h(n))” 这 
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一 事实 的 证 物 。 这 里 假设 n 三 n,。 因 为 n, = max(n,n,) ， 所 以 我 们 知道 三 n 且 n 三 n,。 因 此 ， 
f(n<cag(n), Hg(n)< oh(n)o 

现在 用 ch(n) 替换 不 等 式 f(n) 三 cg(n) 中 的 g(n) ,就 证 明了 From 和 ccponD 。 该 不 等 式 就 证 明 
了 f(n) 是 O(h(n)) o 


+ 示例 3.5 
从 示例 3.3 中 可 知 
7(D) =371 +10n’ —4n’ +n+l 
是 O(n’)， 还 可 以 从 规则 “常数 因子 不 产生 影响 ”中 知道 是 O(0.01n’) 。 通 过 大 0 的 传递 律 ， 
可 知 T(n) 是 0O(0.01n’)。 


3.5.2 ”描述 程序 的 运行 时 间 


我 们 之 前 对 程序 的 运行 时 间 7T(n) 的 定义 是 ,程序 处 理 大 小 为 n 的 任意 输入 所 耗费 时 间 单 位 
的 最 大 值 。 我 们 还 说 过 ， 要 确定 7(n) 的 准确 公式 ， 就 算 不 是 不 可 能 ， 也 将 非常 困难 。 通 常 ， 可 
以 用 大 0 表达 式 O( 了 (n)) 作 为 Tn) 的 上 限 ， 从 而 将 问题 大 大 简化 。 

例如 , SelectionSsort 程 序 的 运行 时 间 7(n) 的 上 限 是 az” , 其 中 a 是 某 个 常数 , 而且 n 宇 1， 
我 们 将 在 3.6 节 中 展示 这 一 事实 。 然 后 可 以 说 SelectionSort 的 运行 时 间 是 O(n*) 。 从 直觉 上 
讲 ， 这 一 陈述 是 最 为 实用 的 ， 因 为 n* 是 个 非常 简单 的 函数 ， 而 且 有 关 其 他 简单 函数 的 更 强 陈述 
(比如 “7T(n) 是 O(n)”) 都 为 假 。 

不 过 ， 因 为 大 O 表 示 法 的 本 性 ， 还 可 以 说 运行 时 间 7(n) 是 O(0.01n*)，, 或 O(7n? -4n+26)， 
或 者 是 任何 二 次 多 项 式 的 大 0。 原 因 在 于 , nw 是 任意 二 次 式 的 大 O, 而 根据 传递 律 ,就 可 以 从 T(n) 
是 O(n ) 这 一 事实 得 出 Tln) 是 任意 二 次 式 的 大 0O。 

更 糟 的 是 ， 关 还 是 任意 三 次 或 更 高 次 多 项 式 ， 或 者 是 任意 指数 式 的 大 0。 因 此 ， 再 次 利用 
传递 性 ，7T(n) 是 O(n ) ，0(2”+n ) ， 等 等 。 不 过 我 们 将 会 解释 ， 为 什么 O(”) 是 表示 
SelectionSort 程 序 的 运行 时 间 的 首选 。 
































3.5.3 ”紧凑 性 


首先 ， 我 们 一 般 都 想 要 达到 可 以 证 明 的 “最 紧 ” 大 O 上 界 。 也 就 是 说 ， 如 果 7(n) 是 O(n)， 
我 们 就 想 作 出 这 一 表述 ， 而 不 是 作出 “7(n) 是 O(m ) ”这 种 技术 上 正确 但 更 弱 的 表述 。 另 一 方 
面 ， 这 种 方式 又 存在 某 种 疯狂 性 ， 因 为 如 果 我 们 喜欢 用 O(n”) 作为 运行 时 间 的 表达 式 ， 就 应 该 
更 喜欢 O(0.5n") ， 因 为 它 更 “紧凑 ”， 而 对 O(0.01n ) 的 喜爱 应 该 就 更 其 了 。 不 过 ， 因 为 在 大 O 
表达 式 中 ， 常 数 因子 是 不 产生 影响 的 ， 所 以 通过 缩小 常数 因子 让 预 估 运 行 时 间 “ 更 紧 竣 ” 的 尝 
试 是 没有 意义 的 。 因 此 ， 只 要 有 可 能 ， 我 们 就 会 试 着 使 用 常数 因子 为 1 的 大 O 表 达 式 。 

图 3-4 列 出 了 一 些 比较 常见 的 程序 运行 时 间 ， 以 及 它们 的 非 正式 名 称 。 特别 要 注意 ，0() 是 
表示 “ 某 个 常数 ”的 惯用 简写 形式 ， 而 且 我 们 还 将 反复 使 用 这 种 用 意 的 0(1) 。 
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大 O 非 正 式 名 称 
CU) 常数 
O(logn) 对 数 
O(n) 线性 
O(nlogn) nlogn 
O(n’) 二 次 
O(n’) 三 次 
O(2") 指数 











图 3-4 “一些 常见 大 0 运行 时 间 的 非 正式 名 称 


更 精确 地 讲 ， 如 果 同 时 满足 如 下 两 点 

(1) Tm) 是 0(f(n)); 

(2) 如 果 7T(n) 是 0O(g(n)) ,那么 f(n) 是 O(g(n)) 也 为 真 (通俗 地 讲 , 我 们 找 不 出 这 样 一 个 函 
数 g(n) ， 它 至 少 与 7(n) 增长 得 一 样 快 ， 却 又 比 fn) 增长 得 慢 )。 

那么 我 们 就 说 f(n) 是 7T(n) 的 紧 大 0 边界 ( tight big-oh bound )。 
+ 示例 3.6 

设 7T(n)=2n +3n， 而 且 f(n)= n?。 我 们 说 ，f(n) 是 Tln) 的 紧 边 界 (tightbound )。 要 知道 
为 什么 ， 先 假设 Tln) 是 0(g(n)) 。 然 后 ， 存 在 常数 c 和 nn,， 使 得 对 所 有 的 n 三 n, ， 有 
T(n)=2n +3n 三 cg(n)。 那 么 对 n 宇 n, ， 有 g(n) 宇 (2/c)n*。 因 为 f(n) 是 nn ， 所 以 可 得 出 ,对 
hn 宇 n,， 有 f(n) 三 (c/2)e(n)。 因 此 ，f(n) 是 O(g(n))。 

另 一 方面 , f(n)=ni 不 是 7T(n) 的 紧 大 O 边 界 , 现 在 可 以 选择 g(n)= n? ,我 们 已 经 看 到 ,7T(n) 
是 O(g(n)) ， 不 过 不 能 证 明 f(n) 是 0O(g(n))， 因 为 ni 不 是 O(n*)。 因 此 ，w 不 是 7T(n) 的 紧 大 O 
边界 。 
3.5.4 简单 性 

在 我 们 选择 大 O 边 界 时 ， 男 一 个 目标 就 是 函数 表达 式 的 简单 性 。 与 紧凑 性 不 同 ， 简 单 性 有 
时 候 是 种 偏好 问题 。 不 过 ， 一 般 还 是 可 以 按照 如 下 标准 认定 函数 f(n) 是 简单 的 : 

(1) 它 只 有 一 项 ; 

(2) 这 项 的 系数 是 1。 





int Powers0fTwo(int n) 


int i; 
1) i= 0; 
(2) while (n%2 == 0) { 
(3) n = n/2; 
(4) i 


i++; 


} 


(5) return i; 





图 3-5 ”计算 一 个 正 整数 n 中 因数 2 的 数量 
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+ 示例 3.7 

函数 性 是 简单 的 ，27 则 不 是 简单 的 ,因为 系数 不 为 1; 而 n+n 也 不 是 简单 的 ， 因 为 它 包 含 了 
两 项 。 

不 过 ， 也 存在 某 些 情况 ， 其 中 大 O 紧 凑 性 的 上 界 和 简单 性 的 边界 是 相互 冲突 的 目标 。 简 单 
性 边界 并 不 能 说 明 一 切 ， 以 下 就 是 一 个 例子 ， 好 在 这 样 的 情况 在 现实 中 很 少 出 现 。 


+ 示例 3.8 

考虑 一 下 图 3-5 中 的 PowersOfTwo 了 函数， 它 会 接受 一 个 正 参 数 n， 并 计量 n 被 2 整除 的 次 
数 。 也 就 是 说 ， 第 (2) 行 的 测试 询问 n 是 否 为 偶数 ， 如 果 是 ， 就 在 第 (3) 行 的 循环 体 中 删除 一 个 
因数 2。 同样 在 这 次 循环 中 ， 我们 递增 i， 而 参数 i 的 作用 是 计量 我 们 从 n 原 本 的 值 中 删除 的 因 
数 2 的 个 数 。 

设 输入 的 大 小 就 是 zx 本 身 的 值 。while 循 环 的 循环 体 由 两 条 语句 组 成 ， 即 第 (3) 行 和 第 (4) 行 ， 
因此 可 以 说 执行 该 循环 体 一 次 所 需 的 时 间 为 0Q) ， 也 就 是 某 个 与 nz 无 关 的 不 变 时 间 量 。 如 果 该 
循环 要 执行 m 次 , 那么 花 在 执行 循环 上 的 总 时 间 就 将 是 O(m) ,或 者 是 某 个 与 m 成 比例 的 时 间 量 。 
为 单独 执行 第 (1) 行 和 第 (5) 行 ， 以 及 进行 第 一 次 while 循 环 条 件 的 测试 ( 从 技术 上 讲 不 属于 任何 
循环 迭代 的 一 部 分 )， 还 要 在 这 个 量 上 加 上 00) 或 者 某 个 常数 。 因 此 ， 该 程序 消耗 的 时 间 是 
O(m)+0O0()。 根据 低 阶 项 可 被 忽略 的 规则 ， 这 一 时 间 就 是 OGm) ， 除非 m = 0 ， 此 时 这 个 时 间 就 
是 O0) 。 换 个 说 法 就 是 ， 在 输入 az 上 所 花 的 时 间 与 1 加 上 2 整除 z 的 次 数 是 成 比例 的 。 





在 数学 表达 式 中 使 用 大 O 表 示 法 
严格 地 讲 ， 大 O 表 达 式 在 数学 上 正确 的 使 用 方式 只 有 出 现在 “是 ” 字 后 这 一 种 情况 ， 比 如 
“2 是 O(m)”。 不过， 在 示例 3.8 以 及 本 章 余 下 的 内 容 中 ,我 们 将 直接 把 大 O 表 达 式 当 作 加 号 
以 及 其 他 算术 运算 符 的 操作 数 ， 比 如 表示 为 O(n)+O(n*)。 应 将 这 样 使 用 的 大 O 表 达 式 解释 成 
“作为 大 O 的 某 个 函数 ”例如 O(n)+O(n ) 就 表示 “ 某 个 线性 函数 和 某 个 二 次 函数 的 和 ”。 此 外 ， 
O(n)+T(n) 应 该 解释 为 菜 个 线性 函数 与 菜 个 特定 函数 7T(n) 的 和 。 





1 能 被 2 整除 多 少 次 ” 对 每 个 奇数 x 来 说 ， 答 案 为 0。 所 以 对 每 个 奇数 上 ， 都 有 PowersOfTwo 
函数 花 的 时 间 为 O0) 。 不 过 ， 当 n 是 2 的 乘 方 ， 也 就 是 说 当 n 对 某 个 而 言 是 2* 时 ，2 能 整除 z 的 次 
数 正好 是 k。 当 n= 2 时， 可 以 在 等 式 两 边 同时 取 以 2 为 底 的 对 数 ， 得 到 1log, n =k。 也 就 是 说 ， 
m 至 多 是 n 的 对 数 ， 或 者 说 m= O(logn)。” 

因此 ， 可 以 说 PowersofTwo 的 运行 时 间 是 O(logn) 。 这 一 边界 满足 了 我 们 对 简单 性 的 定义 。 
不 过 ， 还 有 更 精确 的 方法 来 统计 Powersofmwo 运 行 时 间 的 上 界 ， 这 就 是 说 ， 它 是 函数 
了 (n)=m(n)+1 的 大 O， 其 中 m(n) 是 n 被 2 整除 的 次 数 。 如 图 3-6 所 示 ， 该 函数 一 点 都 不 简单 。 它 
的 值 在 剧烈 摆动 ， 但 从 没有 超过 1+log,n 。 


中 请 注意 ， 在 大 0 表达 式 中 说 到 对 数 时 ， 是 不 需要 指出 底数 的 。 原 因 在 于 ， 如 果 底 数 分 别 为 ca 和 2 ， 那 么 
log, n= (log, n)(log,5) 。 因 为 log,p 是 个 常数 ， 所 以 可 以 看 到 log,z 和 1og,n 只 有 一 个 常数 因子 的 差别 。 因 此 ， 
函数 log,n 对 于 任何 不 同 底数 x 来 说 都 互 为 大 O， 所 以 根据 传递 律 ， 可 以 在 大 0 表达 式 中 用 任意 的 log, n 来 代 蔡 
log,n ， 其 中 5b 是 不 同 于 a 的 底数 。 
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图 3-6 ”了 轴 数 f(n)=m(n)+1， 其 中 m(n) 是 n 被 2 整除 的 次 数 


因为 PowersofTwo 的 运行 时 间 是 O(f(n)) , 而 logn 叉 不 是 O(f(n)) ,所 以 可 以 说 logn 不 是 
该 程序 运行 时 间 的 紧 边 界 。 男 一 方面 ，f(n) 是 紧 边 界 ， 但 它 不 简单 。 





运行 时 间 中 的 对 数 


和 如果 要 考虑 的 算法 需要 处 理 积分 ( Ina =] 一 dx )， 大 家 可 能 会 因为 它们 出 现在 算法 的 分 析 
中 而 感到 惊讶 。 计算机 科学 家 们 通常 会 把 “logn ”考虑 为 log,n ,而 不 是 Inn 和 1lgn 。 请 注意 ， 
log, n 就 是 将 n 除 以 2 直到 得 到 1 为 止 的 次 数 ， 或 者 换 铝 话说 ， 是 为 了 得 到 n， 相 腾 的 2 的 个 数 。 大 
家 可 能 很 容易 看 出 , n = 2” 其 实 和 说 log, n =k 是 一 样 的 , 只 要 在 两 边 同时 取 以 2 为 底 的 对 数 即 可 。 

PowerSsOfTwo 函 数 会 尽 可 能 多 次 地 用 2 整除 1， 而 且 当 1 是 2 的 乘 方 时 ，1 能 被 2 整除 的 次 数 
就 是 log,n 。 对 数 在 对 分 治 算法 《就 是 在 每 个 阶段 将 输入 等 分 为 两 个 部 分 ， 或 者 分 为 近似 相等 
的 两 部 分 的 算法， 比如 归并 排序 算法 ) 的 分 析 中 会 频繁 地 出 现 。 如 果 我 们 一 开始 有 大 小 为 7 的 
输入 ， 那 么 将 输入 对 半分 ， 直 到 大 小 为 1 的 阶段 数 是 log,n 。 或 者 ， 如 果 1 不 是 2 的 乘 方 ， 就 是 
比 log,n 大 的 最 小 整数 。 





3.5.5 ” 求 和 规则 


假设 某 个 程序 由 两 部 分 组 成 ， 一 部 分 耗费 的 时 间 是 O(n*) ， 而 男 一 部 分 消耗 的 时 间 为 
O(n )。 可 以 将 这 两 个 大 O 边 界 “ 相 加 ”， 从 而 得 出 整个 程序 的 运行 时 间 。 在 很 多 情况 下 ( 包括 
上 述 情况 )， 通 过 应 用 如 下 求 和 规则 ， 可 以 将 大 0 表达 式 “ 相 加 ”。 

假设 已 知 T(n) 是 O(f(n))， 而 且 了 LD(n) 是 O((n))。 此 外 ,假设 三 的 增长 率 不 大 于 了/ 

的 增长 率 ， 也 就 是 说 ，_ 太 (nn) 是 O(f.(n))。 那 么 就 可 以 得 出 “T(n)+TD(n) 是 O(f(m))” 的 

结论 。 

要 证 明 这 一 规则 ， 我们 知道 存在 常数 c!/、c,，、c3、n1、np 和 n3， 使 得 

(1) 如 果 n 三 nn ， 则 Tn) 志 cf (0n); 

(2) 如 果 n 三 n,， 则 Tm) 二 cf0n); 

(3) 如 果 n 三 n， 则 fm) 三 cf(n)。 

设 no 是 nt、w 和 nn 中 最 大 的 那个 ， 则 当 三 no 时 ，(Q1)、(2) 和 (G3) 都 成 立 。 因 此 ,对 n 三 n, ， 有 

T+Dn) cf +e fn) 
如 果 使 用 (3) 提 供 (xn) 的 上 边界 ， 那么 完全 可 以 消去 f(n) ， 并 得 出 
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T+DD ECA + eR(n) 
因此 ， 如 果 定 义 c 为 c+cc;， 就 证 明了 对 于 所 有 的 n 三 n, ， 有 
T(n)+D(n) < cf (n) 
这 一 命题 刚好 就 是 我 们 需要 得 出 的 结论 一 一 Tn)+D(n) 是 0O(f(n))。 








+ 示例 3.9 

考虑 一 下 图 3-7 中 的 程序 段 。 该 程序 会 使 A 成 为 n 阶 单位 矩阵 。 第 (2) 行 至 第 (4) 行 在 该 nxn 二 
维 数组 的 每 个 单元 中 都 放 上 0， 接 着 第 (5) 行 和 第 (6) 行 会 在 从 A[0] [0] 到 A[n-1] [n-1] 的 对 角 
线 线 上 的 位 置 中 放 入 1。 结 果 就 形成 了 具有 对 于 任意 nxn 和 矩阵 M 都 有 如 下 属性 的 单位 矩阵 A。 








AxM=MxA=M 








1) scanf ("%d' ,&n); 

(2) for (i = 0; i < n; i++) 

3) for (j = 0; j < ni j++) 
(4) ALi][j] = 0; 

5) for (i = 0; i < n; i++) 

6) ALi Li] = 1; 





图 3-7 创建 单位 矩阵 A 的 程序 段 


第 (1) 行 会 读 取 n, 人 花 的 时 间 为 0Q) ,也 就 是 某 个 和 n 值 无 关 的 固定 时 间 量 。 第 (6) 行 中 的 赋值 
语句 花 的 时 间 也 是 为 0Q) ， 第 ($) 行 和 第 (6) 行 的 循环 要 进行 za 次， 在 该 循环 上 花 的 总 时 间 就 是 
O(n) 。 类 似 地 ,第 (4) 行 中 的 赋值 语句 花 的 时 间 是 O0) 。 第 (3) 行 和 第 (4) 行 的 循环 要 进行 n 次 ， 秦 
费 的 总 时 间 为 O(n) 。 第 (2) 行 至 第 (4) 行 的 外 层 循环 要 执行 n 次 ,在 每 次 迭代 中 花费 的 时 间 为 O(n) ， 
所 以 总 时 间 就 是 O(n ) 。 

因此 ， 图 3-7 所 示 程 序 的 运行 时 间 就 是 OQ)+O(n*)+O(n) ， 分 别 表示 语句 (1)、 第 (2) 行 至 第 
(4) 行 的 循环 ， 以 及 第 (5) 行 和 第 (6) 行 的 循环 。 更 正式 地 讲 ， 如 果 以 下 几 点 同时 成 立 : 

T(n) 是 第 (1) 行 所 花 的 时 间 ; 

Ln) 是 第 (2) 行 至 第 (4) 行 所 花 的 时 间 ; 

了 (nn) 是 第 (5) 行 和 第 (6) 行 所 花 的 时 间 。 

那么 可 以 得 出 如 下 结论 。 

T(n) 是 0(); 

也 (2) 是 OO ) ; 

Tn) 是 O(n)。 

此 我 们 需要 TT(n)+ 艺 (n)+ 世 (n) 的 上 界 ， 从 而 得 出 整个 程序 的 运行 时 间 。 

因为 常数 1 显然 是 O(02) ， 所 以 可 以 应 用 求 和 规则 得 出 Tn)+ 有 (mn) 是 O(n") 。 因 为 ?是 
O(02) ， 就 可 以 对 (T(n)+ 有 (nm)) 和 工 (n) 应 用 求 和 规则 ， 从 而 得 出 T(n)+ 有 (WD)+ 人 TW) 是 O(n )。 
也 就 是 说 ， 图 3-7 所 示 的 整个 程序 段 的 运行 时 间 是 O(n”) 。 通 俗 地 讲 ， 就 是 整个 程序 几乎 将 所 有 
的 运行 时 间 都 花 在 了 第 (2) 行 至 第 (4) 行 的 循环 上 ， 正 如 我 们 从 以 下 事实 中 很 容易 就 能 想到 的 : 对 
于 很 大 的 x， 和 矩阵 的 面积 ?要 比 由 n 个 单元 组 成 的 对 角 线 大 得 多 。 

示例 3.9 应 用 了 “ 低 阶 项 不 产生 影响 ”这 条 规则 ， 因 为 我 们 舍弃 了 1 和 nn 这 两 项 比 n 次数 更 低 
的 多 项 式 。 不 过 ， 求 和 规则 不 仅仅 能 让 我 们 舍弃 低 阶 项 。 如 果 有 任意 多 个 相同 的 大 O 常 数 项 ， 
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比如 有 一 列 10 个 赋值 语句 ， 每 个 赋值 语句 所 花 的 时 间 都 是 0() ， 那么 就 可 以 将 这 10 个 0Q)“ 加 
起 来 "， 得 到 0() 。 不 那么 严格 地 讲 就 是 ，10 个 常数 的 和 还 是 个 常数 。 要 知道 原因 ， 请 注意 1 是 
OG) ， 所 以 10 个 00) 中 任何 一 个 都 可 以 “被 加 到 ”其 他 任意 一 个 Od) 上， 从 而 得 出 00) 这 个 结 
果 。 我 们 可 以 不 断 合 并 项 ， 直 到 只 剩 下 0() 为 止 。 

不 过 ， 必 须要 小 心 ， 不 要 把 某 个 像 O(1) 这 样 的 “常数 ”项 ， 与 这 些 随 输入 大 小 变化 的 项 弄 
混 了 。 例 如 ,我们 有 可 能 错误 地 认为 ， 每 进行 一 次 图 3-7 中 第 (5) 行 和 第 (6) 行 所 示 的 循环 ， 花 的 
时 间 为 0Q) ， 而 该 循环 总 共 循 环 了 za 次 ， 所 以 第 (3) 行 和 第 (0) 行 的 总 运行 时 间 就 是 
OO+OOD+OGD+…+(2 个 OG) ， 而 求 和 规则 告诉 我 们 两 个 00) 的 和 也 是 0() ， 这样， 根据 归 
纳 法 就 可 以 得 出 结论 : 任意 多 个 0() 的 和 都 是 0(Q)。 但 是 ， 在 这 个 程序 中 ，n 不 是 常数 ， 它 会 
因 输 入 大 小 而 异 。 因 此 , 我 们 没 法 通过 多 次 应 用 求 和 规则 推断 出 n 个 Od) 具有 任何 特殊 的 值 。 当 
然 ， 如 果真 要 考虑 这 个 问题 ,那么 我 们 知道 n 个 c 的 和 (其 中 c 是 某 个 常数 ) 是 cn ， 该 函数 的 大 O 
形式 是 O(n) ， 而 这 就 是 第 (5) 行 和 第 (6) 行 真正 的 运行 时 间 。 


3.5.6 不 相称 函数 


任意 两 个 函数 f(n) 和 g(n) 可 由 大 O 相 比较 。 也 就 是 说 , 要 么 f(n) 是 0(g(n)) , 要 么 g(n) 是 
O(f(n))。 或 者 二 者 互 为 对 方 的 大 O， 因 为 我 们 看 到 过 ，2n? 和 nn? +3n 这 两 个 函数 就 是 这 种 互 为 
大 0 的 关系 。 这 种 情况 是 很 不 错 的 。 不 过 不 巧 的 是 ， 也 有 一 些 不 相称 的 函数 对 ， 它 们 之 间 不 存 
在 任何 大 O 关 系 。 


+ 示例 3.10 
考虑 如 下 函数 
_ fn, 为 奇数 
A 上 为 偶数 
也 就 是 ，f0)=1，f(2)=4，f(G)=3，f(4)=16，f(5)=5， 等 等 。 类似 地 ,假设 有 函数 
12 ,为 奇数 
sm-| 











n， 为 偶数 
那么 f(n) 不 可 能 是 O(g(n)) ,因为 那些 偶数 n。 因为 如 我 们 在 3.4 节 中 看 到 的 , n? 绝对 不 是 O(n) 。 
类 似 地 ，g(n) 也 不 可 能 是 O(f(n)) ， 因 为 那些 奇数 上 ， 当 7 为 奇数 时 ,8g 的 值 比 /的 值 增长 得 更 快 。 


3.5.7 “习题 


(1) 证 明 如 下 命题 。 
(a) 如 果 a 科 ,那么 妈 是 O02) 。 
(b) 如 果 qb ， 那 么 mn 不 是 O(n”)。 
(c) 如 果 1<a 三 bp ， 那么 a" 是 0(b")。 
(d) 如 果 1<=b<a ， 那么 a" 不 是 0(b")。 
(e) 对 任意 a 和 任意 b>1 ，n“ 是 0(b")。 
(f 对 任意 5 和 任意 a>1 ，a” 是 O(n’)。 
(g) 对 任意 a 和 任意 b>0 ，(logn)" 是 O(n’)。 
(h) 对 任意 5 和 任意 a>0 ，n' 不 是 0((logn)”)。 
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O) 证 明 : f(n)+g(n) 是 O(max(f(n),g(n)))。 

(G) 假设 T(n) 是 O(f(n)) ， 且 g(n) 是 某 个 值 不 为 负 的 函数 。 证 明 : g(n)T(n) 是 0(g(n)f(n))。 

(4) 假 设 Sn) 是 O(f(n))， 有 是 f(n) 是 0O(g(n)) ， 而 且 这 些 函 数 对 任意 n 都 不 为 负 值 。 证明: S(n)T(n) 
是 O(f (ne(n))。 

(5) 假 设 f(n) 是 O(g(n))。 证 明 : max(f(n),g(n)) 是 0(g(n))。 

(9* 证明: 如 果 fi(n) 和 (n) 都 是 某 个 函数 Tn) 的 紧 边 界 ， 那么 f(n) 和 万 Co) 互 为 对 方 的 大 0。 

(7)* 证 明 : 对 于 图 3-6 所 示 的 函数 f(n) ，log,n 不 是 O(f(n))。 

(8) 在 图 3-7 所 示 的 程序 中 , 通过 先 在 矩阵 中 每 个 位 置 放 上 0， 然 后 在 对 角 线 上 放 上 1,， 我 们 创建 了 一 个 
单位 矩阵 。 将 第 (4) 行 的 测试 改 为 询问 是 否 有 i= j ， 如 果 是 ， 则 在 A[i] [j] 中 放 上 1， 如 果 不 是 ， 
则 放 上 0， 这 样 修改 后 似乎 能 更 快 地 完成 这 一 工作 。 然 后 我 们 还 可 以 删除 第 (5) 行 和 第 (6) 行 。 

(a) 写 出 这 一 程序 。 

(b)* 考虑 图 3-7 中 的 程序 以 及 自己 为 问题 (a) 编 写 的 程序 。 作 出 示例 3.1 中 那样 的 简化 假设 ,计算 两 
个 程序 分 别 耗费 了 多 少 个 时 间 单 位 。 哪 个 程序 更 快 ?” 用 不 同 大 小 的 二 维 数 组 运行 这 两 个 程序 ， 
并 绘制 它们 的 运行 时 间 曲 线 。 


3.6 分析 程 序 的 运行 时 间 


掌握 了 大 0 的 概念 ， 以 及 3.4 节 和 3.5 节 中 介绍 的 那些 处 理 大 0 表达 式 的 规则 之 后 ， 我 们 将 要 
学 习 如 何 获得 常见 程序 运行 时 间 的 大 O 上 界 。 只 要 有 可 能 , 我 们 将 只 考虑 那些 不 含 函 数 调用 ( 除 
了 诸如 printf 那 样 的 库 函 数 ) 的 程序 , 将 含有 函数 调用 的 问题 留待 3.8 节 及 以 后 的 内 容 中 介绍 。 

我 们 不 指望 能 够 分 析 任 意 程序 ， 因 为 有 关 运 行 时 间 的 问题 可 能 是 非常 难 的 数学 问题 。 另 一 
方面 ， 只 要 了 解 一 些 简单 的 规则 ， 我 们 就 能 够 计算 出 实践 中 遇 到 的 多 数 程序 的 运行 时 间 。 

3.6.1 简单 语句 的 运行 时 间 

这 里 要 求 读者 接受 这 样 一 个 原则 ， 即 某 些 对 数据 的 简单 操作 可 以 在 OO) 时间 内 完成 ， 也 就 
是 说 ， 这 个 时 间 是 和 输入 大 小 无 关 的 。C 语 言 中 的 这 些 基本 操作 包括 : 

(1) 算术 运算 〈 比如 + 或 gs ); 

(2) 边 辑 运算 〈 比 如 && ); 

(3) 比较 运算 〈 比 如 <= ); 

(4) 结构 体 存 取 操 作 ( 比如 A[i] 这 样 的 数组 索引 ， 或 者 跟 在 指针 后 的 -> 运算 符 ); 

(5) 简单 的 赋值 (比如 将 某 个 值 复制 到 某 个 变量 中 ); 

(6) 对 库 函 数 ( 比如 scanf、printf ) 的 调用 。 

对 这 一 原则 的 验证 需要 对 和 常见 计算 机 的 机 需 指 令 〈 初始 步骤 ) 进行 详细 人 研究。 我 们 很 容易 
看 出 ， 之 前 描述 的 每 种 操作 都 只 需要 少量 机 带 指 令 便 可 完成 ， 通常 只 需要 1 条 或 2 条 指令 。 

因此 ， 在 C 语 言 中 有 好 几 种 语句 都 能 在 OQ) 时 间 内 执行 完 ， 也 就 是 说 ， 可 以 在 与 输入 无 关 
的 某 个 时 间 段 内 执行 完 。 这 些 简单 语句 包括 : 

(1) 表达 式 中 不 涉及 函数 调用 的 赋值 语句 ; 

(2) 读 语句 ; 

(3) 不 需要 调用 函数 确定 参数 值 的 写 语句 ; 

(4) 跳 转 语句 break、continue 、goto 和 return 表 达 式 ， 其 中 表达 式 不 含 国 数 调用 。 
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在 第 (1) 到 第 (3) 条 中 ,这些 语 名 都 是 由 有 限 数量 的 基本 操作 构成 的 , 每 个 操作 花 的 时 间 都 是 
0() 。 由 求 和 规则 可 知 ， 整 个 语句 花 的 时 间 是 0(Q) 。 当 然 ， 语 句 对 应 的 时 间 常 数 要 比 单个 操作 
对 应 的 常数 大 ， 不 过 我 们 已 经 知道 ， 无 论 如 何 也 不 能 将 具体 的 常数 与 C 语 言语 句 的 运行 时 间 关 
联 起 来 。 

+ 示例 3.11 

我 们 在 示例 3.9 中 看 到 ， 图 3-7 中 第 (1) 行 的 读 语 句 ， 以 及 第 (4) 行 和 第 (6) 行 中 的 赋值 ， 每 一 行 
花费 的 时 间 都 是 O() 。 再 看 一 个 例子 ， 即 图 3-8 中 展示 的 选择 排序 程序 段 。 第 (2)、(5)、(6)、(7) 
和 第 (8) 行 ， 每 一 行 花费 的 时 间 都 是 0() 。 








for (i = 0; i < n-i; i++) { 
small = i; 
for (j = i+1; j < n; j++) 
if (A[j] < ALsmall]) 
small = j; 
temp = ALsmal1] ; 
A[small] = A[i]: 
Ar[i] = temp; 


( 
( 
( 
( 
( 
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图 3-8 ”选择 排序 程序 段 


我 们 经 常会 看 到 由 连续 执行 的 简单 语句 构成 的 程序 块 。 如 果 每 条 语句 的 运行 时 间 都 是 
OU ， 那 么 根据 求 和 规则 ， 整 个 程序 块 花 费 的 时 间 也 是 0() 。 也 就 是 说 ， 任 意 固定 多 个 OUD) 的 
和 还 是 0()。 


+ 示例 3.12 

图 3-8 中 的 第 (6) 行 到 第 (8) 行 形成 了 一 个 程序 块 ， 因 为 它们 永远 是 连续 执行 的 。 由 于 每 一 行 
花 的 时 间 都 是 0Q) ， 所 以 第 (6) 行 到 第 (8) 行 的 程序 块 所 花 的 时 间 也 是 0() 。 

请 注意 ,不 应 该 把 第 (5) 行 算 在 程序 块 中 ， 因 为 它 是 第 (4) 行 i£ 语 句 的 一 部 分 。 也 就 是 说 ， 有 
时 候 即 便 不 执行 第 (5) 行 ， 第 (6) 行 至 第 (8) 行 也 会 执行 。 

3.6.2 ”简单 for 循环 的 运行 时 间 

在 C 语 言 中 , 很 多 for 循 环 的 构成 包括 初始 化 指标 变量 为 某 个 值 的 语句 ， 以 及 每 进行 一 次 循 
环 就 将 该 标量 递增 1 的 语句 。 当 该 指标 达到 某 个 限制 后 ，for 循 环 就 终止 了 。 例如 ， 图 3-8 中 第 (1) 
行 的 for 循 环 使 用 了 指标 变量 1。 每 进行 一 次 循环 ， 它 就 将 1 递增 1， 而 当 i 达 到 z -1 时 ， 迭 代 就 
停止 了 。 

在 C 语 言 中 ,还 有 更 复杂 的 for 循 环 ， 其 行为 更 类 似 while 语 句 ， 这 些 循环 迭代 的 次 数 是 不 
可 预知 的 。 本 市 后 面 将 会 介绍 这 种 循环 。 不 过 在 这 里 ， 还 是 将 注意 力 集中 在 形式 简单 的 for 循 
环 上 ， 在 这 种 for 循 环 中 ， 最 终 值 和 初始 值 之 间 的 差 ， 除 以 指标 变量 每 次 递增 的 量 ， 就 可 以 得 
出 循环 了 多 少 次 。 这 种 计数 是 精确 的 ， 除 非 还 存在 一 些 通 过 跳 转 语句 退出 循环 的 方式 ， 否 则 这 
在 任何 情况 下 都 是 迭代 次 数 的 上 界 。 例 如 ， 图 3-8 中 for 循 环 的 第 1 行 会 迭代 ((n-1)-0)/1=n-1l 
次 ， 因 为 0 是 的 初始 值 ，n -1 是 ;达到 的 最 高 值 ( 即 当 i 达到 nn--1 时 ,循环 就 会 终止 ，i=n 一 1 时 
不 会 发 生 迭 代 )， 而 且 循 环 每 次 迭代 i 都 会 增加 1。 
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要 为 for 循 环 的 运行 时 间 找 出 边界 ， 必 须 先 找 到 循环 体 进行 一 次 迭代 所 花 时 间 的 上 界 。 请 
注意 ,进行 一 次 迭代 的 时 间 包 括 递增 循环 指标 ( 比如 图 3-8 第 (1) 行 中 的 递增 语句 i++ ) 所 花 的 时 
间 04)， 以 及 比较 循环 指标 与 上 限 ( 比如 图 3-8 第 (1) 行 中 的 测试 语句 i<n-1 ) 所 花 的 时 间 0() 。 
除了 循环 体 为 空 的 异常 情况 ， 其 他 所 有 情况 下 的 这 些 0(1) 都 可 以 根据 求 和 规则 舍弃 掉 。 

在 最 简单 的 情况 ,也 就 是 循环 体 每 次 迭代 所 花 的 时 间 均 相同 的 情况 下 ， 可 以 用 循环 体 的 大 
O 上 界 乘 上 循环 的 次 数 。 严 格 地 说 ， 还 必须 加 上 初始 化 循环 指标 的 时 间 O() ， 以 及 第 一 次 比较 
循环 指标 和 上 限 的 时 间 O() 。 不 过 ， 除 非 有 可 能 不 执行 循环 ， 否 则 初始 化 循环 和 测试 上 限 的 时 
间 都 是 根据 求 和 规则 可 被 舍弃 的 低 阶 项 。 


+ 示例 3.13 
考虑 图 3-7 第 (3) 行 和 第 (4) 行 中 的 for 循 环 ， 也 就 是 


(3) for (j = 0; j < ni j++) 
(4) A[Li][j] = 0; 


我 们 知道 第 (4) 行 花 的 时 间 为 0() 。 显 然 ， 我们 要 进行 n 次 循环 ， 这 可 以 由 第 (3) 行 找到 的 上 限 减 
去 下 限 再 加 上 1 来 确定 。 因 为 循环 体 ， 也 就 是 第 (4) 行 ,花费 的 时 间 为 0Q) ， 所 以 可 以 忽略 递增 j 
的 时 间 00) 以 及 比较 /与 的 时 间 O() 。 因 此 ,第 (3) 行 和 第 (4) 行 的 运行 时 间 为 n 与 0() 的 积 ， 也 
就 是 O(n) 。 

类 似 地 ， 可 以 确定 由 第 (2) 行 至 第 (4) 行 构成 的 外 层 循环 的 运行 时 间 边 界 ， 外 层 循环 如 下 。 





的 | for (i = 0; i < n; i++) 
(3) for (j = 0; j < n; j++) 
(4) A[Li][j] = 0; 


我 们 已 经 得 到 第 (3) 行 和 第 (4) 行 的 循环 所 花 的 时 间 为 O(n) 。 因 此 ,可 以 忽略 递增 i 的 时 间 00) 以 
及 每 次 迭代 时 测试 是 否 有 i<n 所 花 的 时 间 0Q) ， 并 得 出 外 层 循环 每 次 迭代 所 花 的 时 间 为 O(n) 。 
外 层 循 环 初始 化 i2=0， 以 及 第 (n+1) 次 i<n 的 条 件 测试 花 的 时 间 都 是 OQ) ， 而 且 都 可 以 忽略 。 

最 终 , 我 们 看 到 外 层 循 环 要 循环 n 次 , 而 每 次 迭代 的 时 间 都 是 O(n) , 因此 总 运行 时 间 就 是 O(n ) 。 


+ 示例 3.14 

现在 来 考虑 图 3-8 第 (3) 行 到 第 (5) 行 中 的 for 循 环 。 在 这 里 ,循环 体 是 if 语 句 ， 是 我 们 接 下 来 
将 要 了 解 如 何 进行 分 析 的 结构 。 不 难 推断 出 第 (4) 行 花费 时 间 00) 执行 测试 , 第 (5) 行 如 果 执 行 的 
话 也 会 花费 时 间 0(1)， 因 为 它 是 不 合 防 数 调用 的 赋值 语句 。 因 此 ， 不 管 第 (5) 行 是 否 执行 ， 执 行 
for 循 环 循环 体 所 花 的 时 间 都 为 0() ， 循 环 中 的 递增 和 测试 增加 的 时 间 都 是 OQ) ， 所 以 循环 进 
行 一 次 遂 代 的 总 时 间 也 只 是 0()。 

现在 我 们 必须 计算 进行 循环 的 次 数 。 和 迭代 次 数 是 与 输入 大 小 zx 无 关 的 。 而 公式 “最 后 的 值 减 
去 初始 值 除 以 递增 量 ” 告 诉 我 们 ，(za-G+D)/1， 或 者 说 -二 1 ， 是 循环 迭代 的 次 数 。 严 格 地 
说 , 该 公式 只 有 在 i<n 时 才 成 立 。 好 在 我 们 从 图 3-8 的 第 (1) 行 可 以 看 出 ,除非 i 三 n-2， 否 则 我 
们 不 会 进入 第 (2) 至 第 (8) 行 的 循环 体 。 因 此 ， 我 们 不 仅 知道 了 ni-1 是 循环 迄 代 的 次 数 ， 而 且 
知道 了 这 个 数值 不 可 能 为 0。 由 此 可 以 得 出 该 循环 所 花 的 时 间 为 (n-i-1)x0() ， 或 者 说 是 
O(n 一 i 一 1) 。 此 处 不 必 加 上 初始 化 j 所 花 的 时 间 O() ， 因 为 已 知 n-i-1 不 可 能 为 0。 如 果 看 不 








(D 从 技术 上 讲 , 我 们 没有 讨论 过 应 用 到 多 变量 函数 上 的 大 0 运算 符 。 在 这 种 情况 中 , 可 以 将 Ow -i-]) 说 成 是 “最 
多 为 某 个 常数 乘 以 ni-1”。 也 就 是 说 ， 可 以 将 ni-1 视 为 某 个 单 变 量 函 数 的 蔡 代 物 。 
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出 n-i-1 为 正 的 话 ， 就 必须 将 运行 时 间 的 上 界 写 为 O(max(1, ni-1)) 。 
3.6.3 选择 语句 的 运行 时 间 
if-else 选 择 语句 具有 如 下 形式 : 


if (<condition>) 
<if-part> 

else 
<else-part> 





其 中 

(1) 条 件 是 竺 评估 的 表达 式 ; 

(2) it 部 分 的 语句 只 有 在 条 件 为 真 (表达 式 的 值 不 为 0 ) 时 才 执 行 ; 

(3) else 部 分 的 语句 只 有 在 条 件 为 假 (评估 为 0 ) 时 才 执行 ，else 后 的 <else-part> 是 可 
选 的 。 

只 要 条 件 中 没有 函数 调用 ,不管 条 件 多 么 复杂 ， 痢 只 需要 计算 机 执行 一 定量 的 基本 操作 。 
因此 ， 条 件 评估 所 花 的 时 间 为 O0) 。 

假设 在 条 件 中 没有 函数 调用 , 而 且 if 部 分 和 else 部 分 分 别 具 有 大 O 上 界 f(n) 和 g(n)。 还 假 
设 f(n) 和 g(n) 不 会 都 为 0， 也 就 是 说 ， 尽 管 else 部 分 可 能 不 存在 ， 但 if 部 分 是 不 会 为 空 的 。 我 
们 将 确定 两 部 分 都 为 空 的 时 候 会 发 生 什么 留 作 本 节 的 习题 。 

如 果 f(n) 是 O(g(n))， 那 么 可 以 将 O(g(n)) 作 为 选择 语句 运行 时 间 的 上 界 。 原 因 包 括 : 

(1) 可 以 忽略 条 件 所 花 的 时 间 0(1) ; 

(2) 如 果 else 部 分 执行 ， 就 可 知 g(n) 是 运行 时 间 的 边界 ; 

(3) 如 果 ifE 部 分 ( 而 不 是 else 部 分 ) 执行 ， 那 么 运行 时 间 将 是 0O(g(n)) ， 因 为 f(n) 是 
O(g(n))。 

类 似 地 ， 如 果 g(n) 是 0O(f(n)) ， 就 可 以 通过 O(f(n)) 确 定 选择 语句 运行 时 间 的 边界 。 请 注 
， 当 else 部 分 不 存在 时 ( 情况 也 常常 是 这 样 )，g(n) 为 0， 就 肯定 是 O( f(n))。 

当 / 和 sg 之 间 不 存在 大 0 关系 时 ， 问 题 出 现 了 。 我 们 知道 i 部 分 或 else 部 分 肯定 有 一 种 要 执 
行 , 但 不 可 能 都 执行 , 所 以 运行 时 间 的 安全 上 界 就 是 f(n) 和 g(n) 中 的 较 大 者 。 正 如 我 们 在 示例 
3.10 中 看 到 的 ， 二 者 谁 比较 大 可 能 取决 于 n。 因 此 ， 要 将 选择 语句 的 运行 时 间 表 示 为 
O(max(f(n),g(n))) 5 

















Bulg 








+ 示例 3.15 

正如 我 们 在 示例 3.12 中 看 到 的 ， 图 3-8 中 第 (4) 行 和 第 (5) 行 是 选择 语句 ， 其 中 第 (5) 行 是 if 部 
分 ， 所 花 时 间 为 0(1) ， 而 不 存在 else 部 分 ( 也 就 是 所 花 时 间 为 0)。 因 此 ，/(n) 是 1 且 g(D) 是 0。 
由 于 g(n) 是 O(f(n))， 可 以 得 出 00) 是 第 (4) 行 和 第 (5) 行 运行 时 间 的 上 界 。 请 注意 ， 在 第 (4) 行 
执行 测试 A[j]<A[small] 的 时 间 O00) 可 以 忽略 。 
+ 示例 3.16 


图 3-9 所 示 的 代码 段 是 个 更 为 复杂 的 例子 , 它 执行 的 ( 相对 无 意义 的 ) 任 务 是 将 矩阵 A 置 为 0， 
或 是 将 矩阵 的 对 角 线 置 为 1。 一 如 我 们 在 示例 3.13 中 所 了 解 的 ， 第 (2) 行 至 第 (4) 行 的 运行 时 间 是 
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O(2) , 而 第 (5) 行 和 第 (6) 行 的 运行 时 间 是 O(n) 。 因 此 这 里 的 f(n) 是 rw, g(n) 是 n。 因为 ?是 O02 ) 
所 以 可 以 忽略 else 部 分 的 时 间 , 并 将 O(n ) 作为 网 3-9 中 整个 程序 段 运行 时 间 的 边界 。 也 就 是 说 ， 
我 们 不 知道 第 (1) 行 的 条 件 是 否 将 为 真 或 者 什么 时 候 将 为 真 ， 不 过 唯一 安全 的 上 界 是 从 最 坏 的 假 
设 中 得 出 的 ， 即 条 件 为 真 而 且 iE 部 分 执行 了 。 




















if (AL1][1] == 0) 
for (i = 0; i < n; i++) 
for (j = 0; j < n; j++) 


A[ij[j] = 0; 
else 
for (i = 0; i < n; i++) 
A[i] [i] = 1; 








图 3-9 ”if-else 选 择 语 句 的 示例 


3.6.4 程序 块 的 运行 时 间 

前 文 已 经 提 到 , 一 系列 赋值 、 读 、 写 操作 , 每 一 次 操作 的 时 间 都 是 O0) , 总 时 间 也 是 O0) 。 
一 般 的 情况 是 ， 必 须 能 将 一 系列 语句 ( 其 中 有 一 些 是 复合 语句 ， 也 就 是 选择 语句 或 循环 ) 组 合 
起 来 。 这 样 一 系列 简单 的 复合 语句 就 是 程序 块 (block )。 要 计算 程序 块 的 运行 时 间 ， 需 要 对 程 
序 块 中 每 条 ( 可 能 是 复合 的 ) 语句 的 大 O 上 界 求 和 。 好 在 可 以 使 用 求 和 规则 消除 和 中 的 一 些 项 。 














+ 示例 3.17 

在 图 3-8 的 选择 排序 程序 段 中 ， 可 以 将 外 层 循环 的 循环 体 (也 就 是 第 (2) 行 至 第 (8) 行 ) 视 为 
一 个 程序 块 。 该 程序 块 由 5 条 语句 组 成 。 

(1) 第 (2) 行 的 赋值 语句 。 

(2) 第 G3) 行 、 第 (4) 行 和 第 (5) 行 的 循环 。 

(3) 第 (6) 行 的 赋值 语句 。 

(4) 第 (7) 行 的 赋值 语句 。 

(5) 第 (8) 行 的 赋值 语句 。 

请 注意 , 第 (4) 和 第 (5) 行 的 选择 语句 以 及 第 (5) 行 的 赋值 在 程序 块 这 一 级 是 不 可 见 的 , 它们 已 
经 隐藏 在 更 大 的 语句 ， 也 就 是 第 (3) 行 至 第 (5) 行 的 循环 中 了 。 

我 们 知道 ，4 条 赋值 语句 每 条 所 花 的 时 间 都 是 0(Q) 。 在 示例 3.14 中 , 已 经 了 解 到 该 程序 块 中 
第 2 条 语句 (也 就 是 第 (3) 行 至 第 (5) 行 ) 的 运行 时 间 是 O(n--i-1) 。 因此, 该 程序 块 的 运行 时 间 是 : 
O(N)+O(n-i-D)+00)+00+00) 

因为 1 是 O(n -i-1)( 回想 一 下 ,我 们 还 推导 出 i 从 不 会 大 于 nn 一 2 )， 所 以 可 以 通过 求 和 规则 
消除 所 有 的 0() 项 。 因 此 ， 整 个 程序 块 的 运行 时 间 就 是 O(n -1D 。 

再 看 一 个 例子 ， 考 虑 一 下 图 3-7 中 的 程序 段 。 它 可 被 视 为 由 3 条 语句 组 成 的 单一 程序 块 。 

(1) 第 (1) 行 的 读 语句 。 

(2) 第 (2) 行 至 第 (4) 行 的 循环 。 

(3) 第 (5) 行 和 第 (6) 行 的 循环 。 

我 们 知道 , 第 (1) 行 花 的 时 间 为 O(D 。 从 示例 3.13 可 知 , 第 (2) 行 至 第 (4) 行 花 的 时 间 是 0(n?)， 
第 (5) 行 和 第 (6) 行 花 的 时 间 是 O(n) 。 所 以 整个 程序 块 的 运行 时 间 就 是 : 
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O()+O(n’)+O(n) 
根据 求 和 规则 , 由 O47) 可 以 消去 O00) 和 O(n) 。 因 此 可 以 得 出 图 3-7 中 程序 段 的 运行 时 间 为 O(n) 。 


3.6.5 ”复杂 循环 的 运行 时 间 


在 C 语 言 中 ， 有 一 些 while 循 环 、do-while 循 环 和 和 for 循环 并 未 提供 显 式 的 计数 变量 。 对 于 
这 些 循环 ， 一 部 分 分 析 工 作 就 是 要 找到 为 循环 近代 次 数 提供 上 界 的 参数 。 这 些 证 明 过 程 通常 都 
遵循 我 们 在 2.5 节 中 了 人 解 的 模式 。 也 就 是 说 ,通过 对 循环 次 数 的 归纳 证 明 某 个 命题 ， 而 该 命题 表 
明 在 迭代 次 数 达到 某 个 限制 后 ， 循 环 条 件 一 定 会 变 为 假 。 

我 们 还 必须 建立 执行 一 次 循环 迭代 所 花 时 间 的 边界 。 因 此 ， 可 以 对 循环 体 加 以 研究 ， 并 获 
得 其 执行 的 边界 。 为 了 实现 这 个 目标 ， 必 须 在 循环 体 执行 后 加 上 测试 条 件 的 时 间 0Q) ， 不 过 除 
非 循 环 体 不 存在 ， 否 则 我 们 都 会 忽略 该 0() 项。 通过 用 六 代 次 数 的 上 界 乘 以 一 次 迭代 所 花 时 间 
的 上 界 ， 可 以 得 到 循环 运行 时 间 的 边界 。 从 技术 上 讲 ， 如 果 该 循环 是 for 循 环 或 while 循 环 ， 而 
不 是 so-while 循 环 ， 就 必须 将 进入 循环 体 之 前 第 一 次 测试 条 件 所 需 的 时 间 包 含 在 内 。 不 过 ,这 
个 OU) 经 常 是 可 以 忽略 掉 的 。 





+ 示例 3.18 
考虑 如 图 3-10 所 示 的 程序 段 。 该 程序 会 搜索 数组 A[0. .n-1] ， 找 出 该 数组 中 的 元 素 x。 





(1) i = 0; 
(2) while(x != A[i]) 
(3) i++; 





图 3-10 ”线性 查找 的 程序 段 


图 3-10 中 第 (1) 行 和 第 (3) 行 的 两 条 赋值 语句 的 运行 时 间 均 为 0(1) 。 第 (2) 和 第 (3) 行 的 while 循 
环 可 能 会 执行 次， 但 不 会 超过 nn 次， 因为 我 们 假设 x 确实 是 数组 元 素 之 一 。 因 为 第 (3) 行 的 循环 
体 所 需 时 间 为 0(Q) ， 所 以 该 while 循 环 的 运行 时 间 就 是 O(n) 。 根 据 求 和 规则 ， 整 个 程序 段 的 运 
行 时 间 为 O(n) ， 因 为 这 是 第 (1) 行 的 赋值 语句 以 及 整个 while 循 环 所 花 的 最 大 时 间 。 在 第 6 音 中 ， 
我 们 还 将 看 到 这 种 O(n) 程序 是 如 何 被 使 用 二 又 查找 的 O(log n) 程序 所 代替 的 。 


3.6.6 ”习题 


(1) 对 开头 为 for (i = a; i <= b; i++) 的 for 循 环 ， 用 a 和 2b 的 函数 表示 其 循环 次 数 。 对 开头 为 for 
(i = a; i <= b; i--) 的 for 循 环 又 是 怎样 表示 的 呢 ? 对 开头 为 for (i = a; i <= b; i = i+c) 
的 for 循 环 呢 ? 

(2) 给 出 某 个 普通 的 选择 语句 if (C) {} 运行 时 间 的 大 0O 上 界 ， 其 中 C 是 不 涉及 任何 函数 调用 的 条 件 。 

(3) 给 出 某 个 普通 的 while 循 环 while(C) {} 运 行 时 间 的 大 O 上 界 ， 其 中 C 是 不 涉及 任何 也 数 调用 的 
条 件 。 

(4)* 给 出 C 语 言 switch 语 句 运行 时 间 的 规则 。 

(5) 给 出 我 们 能 确定 哪 条 分 支 被 执行 的 选择 语句 运行 时 间 的 规则 ， 比 如 
if (1==2) 

Something O(f(n)); 
else 
something O(g(n)); 
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(6) 给 出 循环 开始 前 条 件 已 知 为 假 的 退化 while 循 环 (degenerate while-loop ) 运行 时 间 的 规则 ， 比 如 


while (1 != 1) 
something O(f(n)); 


3.7 ”边界 运行 时 间 的 递归 规则 


在 3.6 节 中 ,我 们 简略 地 描述 了 一 些 规 则 ,它们 用 程序 结构 各 部 分 的 运行 时 间 来 定义 整个 程 
序 结构 的 运行 时 间 。 例 如 ， 我 们 说 过 for 循 环 的 运行 时 间 大 人 致 等 于 循环 体 所 花 的 时 间 乘 以 迭代 
的 次 数 。 隐 藏 在 这 些 规则 背后 的 概念 是 ， 程 序 是 使 用 归纳 规则 构成 的 ， 复 合 语句 〈 循 环 、 选 择 
和 其 他 由 子 语句 组 成 的 语句 ) 通过 这 些 规 则 由 诸如 赋值 、 读 、 写 和 跳 转 语句 这 样 的 简单 语句 组 
成 。 这 些 归纳 规则 涵盖 循环 的 形成 、 选 择 语句 及 程序 块 等 一 系列 复合 语句 。 

我 们 要 将 一 些 构建 C 语 言语 句 的 句法 规则 表述 为 递归 定义 。 这 些 规 则 符合 经 常 出 现在 C 语 言 
教材 中 的 那些 定义 C 语 言 的 语法 规则 。 我 们 在 第 11 章 中 还 将 看 到 ， 语 法 可 以 用 作 人 简洁 递归 表示 
法 ， 来 指明 编程 语言 句法 (syntax )。 














更 具 防 御 性 的 程序 设计 

如 果 大 家 只 是 因为 相信 示例 3.18 中 的 数组 RA 总 会 存在 元 素 Y， 就 认为 它 总 会 存在 ， 那 就 太 天 
真 了 。 请 注意 ， 如 果 数 组 中 不 存在 ff， 图 3-10 中 的 循环 将 最 终 会 出 错 ， 因 为 它 要 试 着 访问 一 个 
超过 数组 上 限 的 数组 元 素 。 

好 在 有 一 种 简单 的 方法 可 以 避免 这 一 错误 ,而且 不 会 给 循环 的 每 次 迭代 增加 很 多 时 间 。 我 
们 允许 数组 末尾 有 第 n+1 个 单元 , 而 在 开始 循环 前 ， 将 x 放 在 该 单元 中 。 屠 么 确实 能 确定 x 会 出 
现在 数组 中 的 某 个 位 置 。 当 循环 结束 后 ， 我 们 会 测试 是 否 有 i=n 。 如 果 是 ， 那 么 x 并 非 真正 在 
数组 中 ， 我 们 会 穿 过 数组 到 达 作 为 哨兵 ( Sentinel ) 的 x 的 副本 。 如 果 i<=n ， 那么 i 就 表示 x 出 现 的 
位 置 。 带 有 这 种 保护 功能 的 程序 如 下 所 示 。 


下 [页 ] = ¥: 
i = 0; 
while (x != A[i]) 
i++; 
if (i == n) /* do something appropriate to the case 


that x is not in the array */ 
else /* do something appropriate to the case 
that x is found at position i */ 





依据 。 

C 语 言 中 的 简单 语句 如 下 。 

(1) 表达 式 。 包 括 赋值 语句 以 及 读 和 写 语句 ， 后 者 是 对 printf 和 scanf 等 函数 的 调用 ; 
(2) 跳 转 语句 。 包 含 goto、break、continue 和 return; 

(3) 空 语句 。 

请 注意 ,在 C 语 言 中 ,简单 语句 都 是 以 分 号 结尾 的 ， 我 们 要 将 分 号 视 为 这 些 语句 的 一 部 分 。 
归纳 。 

以 下 规则 让 我 们 可 以 用 较 小 的 语句 来 构建 语句 。 

(1) while 语 句 。 如 果 S 是 语句 ， 而 C 是 条 件 ( 带 有 算术 值 的 表达 式 )， 那 么 


while (C)S 
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是 语句 。 只 要 C 为 真 (具有 非 0 的 值 )， 循 环 体 $ 就 会 执行 。 
(2) do-while 语 句 。 如 果 S 是 语句 ， 而 C 是 条 件 ， 那 么 
do S while(C) 
是 语句 。do-while 循 环 和 while 循 环 类 似 ， 只 不 过 do-while 循 环 的 循环 体 S 至 少 会 执行 
= 
(3) for 语 句 。 如 果 S 是 语句 ， 而 Bl1、E2 和 3 是 表达 式 ， 那 么 
for (EF; bE,; E3)S 
是 语句 。 第 一 个 表达 式 E 会 进行 一 次 评估 ， 并 指定 循环 体 S 的 初始 化 。 第 二 个 表达 式 E, 是 对 
循环 终止 的 测试 , 会 在 每 次 迭代 前 进行 评估 。 如 果 它 的 值 不 为 0， 那么 循环 体 就 会 执行 ,否则 该 
for 循 环 就 将 终止 。 第 三 个 表达 式 E 会 在 每 次 迭代 后 进行 评估 , 并 为 循环 的 下 一 次 迭代 指定 重 初 
化 ( 递增 )。 例 如 ， 如 下 常见 的 for 循 环 
for (i = 0; i < n; i++) 9 
其 中 S 会 迭代 nn 次 ， 对 应 的 值 分 别 为 1、2、3、…、n-1。 在 这 里 ，i = 0 是 初始 化 , i < n 
是 终止 测试 ，i++ 是 重 初始 化 。 
(4) 选择 语句 。 如 果 S1 和 $s 是 语句 ， 而 C 是 条 件 ， 那 么 
if(C ) S1 else 9。 
是 语句 ， 而 且 
if(C ) 91 
也 是 语句 。 在 第 一 种 情况 中 ， 如 果 C 为 真 〈 非 0 )， 就 执行 $1， 否 则 就 执行 $,。 在 第 二 种 情况 
中 ， 只 有 当 C 为 真 ， 才 执行 Si。 
(5) 程序 块 。 如 果 S 、S 、… 、gSn 都 是 语句 ， 那 么 
{91 92 .9 
也 是 语句 。 
我 们 在 上 面 没有 列 出 开关 语句 ， 它 形式 复杂 ,但 在 分 析 运 行 时 间 时 可 以 被 当 作 骸 套 的 选择 
语句 。 
利用 上 述 对 语句 的 递归 定义 ， 就 可 以 通过 分 辩 程 序 的 组 成 部 分 来 解析 程序 。 也 就 是 说 ， 首 
先 有 简单 的 语句 ， 青 进一步 将 这 些 简单 的 语句 组 成 更 大 的 复合 语句 。 


+ 示例 3.19 

考虑 图 3-11 所 示 的 选择 排序 程序 段 。 作 为 根据 ， 第 (2) 行 、(5) 行 、(6) 行 、0) 行 和 第 (8) 行 的 
每 次 赋值 都 各 为 一 条 语句 ; 而 第 (4) 行 和 第 (5) 行 组 成 了 选择 语句 ; 第 (3) 行 至 第 (5) 行 又 组 成 了 for 
语句 ; 然后 第 (2) 行 至 第 (8) 行 组 成 了 一 个 程序 块 ， 最后， 整个 程序 段 也 是 for 语 句 。 








for (i = 0; i < n-i; i++) 
small] = i; 
for (j = i+l; j < n; j++) 
if (A[j] < ALsmal1]) 
small = j; 
temp = A[smal1] ; 
A[small] = A[il]: 
A[i] = temp; 


= 








图 3-11 ”选择 排序 程序 段 
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3.7.1 程序 结构 的 树 表示 


我 们 可 以 用 如 图 3-12 所 示 的 树 表示 程序 的 结构 。 树 叶 ( 那些 圆圈 ) 是 简单 语句 ， 而 其 他 的 
节点 则 表示 复合 语句 。 节点 会 被 标记 上 它们 所 表示 结构 的 种 类 , 以 及 构成 该 节点 所 表示 简单 语 
句 或 复合 语句 的 代码 行 。 从 每 个 表示 复合 语句 的 节点 N 邵 会 加 下 引出 到 达 其 “ 子 节 点 ”的 连 线 。 
节点 X 的 子 节 点 表示 构成 V 所 表示 复合 语句 的 那些 子 语 句 。 这 样 的 树 就 称 为 程序 的 结构 树 。 





程序 块 (2)-(8) 








(4)-(5) 


图 3-12 ”表示 语句 组 合 的 树 


+ 示例 3.20 

图 3-12 是 图 3-11 所 示 程 序 的 结构 树 。 每 个 圆圈 分 别 是 表示 图 3-11 中 5 条 赋值 语句 的 树叶 。 我 
们 在 图 3-12 中 没有 说 明 这 5 条 语句 是 赋值 语句 。 

在 树 的 顶端 (也 就 是 “ 根 ”) 是 表示 第 (1) 至 第 (8) 行 整个 程序 段 的 节点 。foz 循 环 的 循环 体 是 
由 第 (2) 行 至 第 (8) 行 组 成 的 程序 块 。“ 该 程序 块 是 用 根 节点 下 方 的 节点 表示 的 。 而 这 个 表示 程序 
块 的 节点 又 有 5 个 子 节 点 ,分 别 表示 该 程序 块 的 5 条 语句 。 其 中 第 (2)、(6)、(7) 和 第 (8) 行 这 4 条 是 
赋值 语句 ， 而 第 5 条 是 第 (3) 行 至 第 (5) 行 的 for 循 环 。 

第 (3) 行 至 第 (9) 行 表示 foz 循 环 的 节点 又 有 表示 其 循环 体 ( 就 是 第 (4) 行 和 第 (5) 行 的 if 语句) 
的 子 节 点 。 而 表示 第 (4) 行 和 第 ($) 行 二 语句 的 节点 又 具有 表示 其 组 成 语句 〈 第 ($) 行 的 赋值 语句 ) 
的 子 市 点 。 


3.7.2 ” 攀 和 结 构 树 以 确定 运行 时 间 
正如 递归 构建 的 程序 结构 那样 ， 我 们 可 以 使 用 类 似 的 递归 方法 来 定义 程序 运行 时 间 的 大 0 








J 我 们 将 在 第 5 章 中 详细 讨论 树 。 
@ 更 为 详细 的 结构 树 还 有 表示 for 循环 初始 化 表达 式 、 终 止 测试 表达 式 和 重 初始 化 表达 式 的 子 节点 。 
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上 界 。 就 像 在 3.6 节 中 那样 ， 我 们 假定 在 下 列 几 类 表达 式 中 都 不 存在 函数 调用 。(1) 构成 赋值 语 
句 、 打 印 语句 、 选 择 语 句 条 件 的 表达 式 ; (2) 构成 while 循 环 、for 循 环 和 do-while 循 环 条 件 的 
表达 式 ; (3) for 循 环 初始 化 或 重 初 始 化 的 表达 式 。 唯 一 的 例外 是 对 诸如 printf 这 样 的 读 函 数 
或 写 函 数 的 调用 。 

依据 。 简 单 语 句 (也 就 是 赋值 、 读 、 写 或 跳 转 语句 ) 的 边界 是 0(1) 。 

归纳 。 对 于 我 们 已 经 讨论 过 的 5 种 复合 结构 ， 计 算 其 运行 时 间 的 规则 如 下 。 

(1) while 语 句 。 设 O(f(n)) 是 while 语 句 循 环 体 的 运行 时 间 上 界 ，f(n) 是 通过 递归 地 应 用 
这 些 规则 得 到 的 。 青 假设 g(n) 是 循环 次 数 的 上 界 。 那 么 O(1+(f(n)+1)g(n)) 就 是 整个 while 循 
环 的 运行 时 间 上 界 ， 其 中 O(f(n)+1) 是 循环 体 加 上 循环 体 后 测试 的 运行 时 间 上 界 。 开 头 那 个 多 
出 来 的 1 表示 循环 开始 前 的 第 一 次 测试 。 在 f(n) 和 g(n) 都 至 少 为 1 (或 者 如 果 不 定 义 其 值 为 1， 
则 其 值 为 0， 我 们 就 可 以 定义 它们 为 1 ) 的 平常 情况 下 ， 可 以 将 该 while 循 环 的 运行 时 间 记 为 
O(f(mg(n)) 。 这 一 运行 时 间 的 通用 公式 如 图 3-13a 所 示 。 

(2) qo-while 语 句 。 如 果 O(f(n)) 是 循环 体 运行 时 间 的 上 界 ， 且 g(n) 是 循环 次 数 的 上 界 ， 
那么 O((f(n)+1)g(n)) 就 是 该 do-while 循 环 的 运行 时 间 上 界 。 这 里 “+1” 表 示 的 是 循环 每 次 迭 
代 之 未 计算 和 测试 循环 条 件 的 时 间 。 请 注意 ， 对 qo-while 循 环 来 说 ，g(n) 总 是 至 少 为 1。 在 对 
所 有 nn 都 有 f(n) 宇 1 的 情况 中 ，gdo-while 循 环 的 运行 时 间 为 O(f(n)g(n)) 。 图 3-13b 表 示 了 计算 
普通 情况 下 的 do-while 循 环 运行 时 间 的 方法 。 


| 


ce> OU) 





CO (e(mAn)) 
至 少 循环 
SO 次 循环 体 O (fn) 
(a) while 语 句 
循环 体 O(f(n) 
CO (g(m)fn)) 


至 少 循环 
8(n) 次 < ou) 


(b) aqo-while 语 名 
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| 


0O(1) 


测试 





O (SCDXD) 


人 循环 8(n) 次 O (fn)) 


a 


重 初始 化 OU) 


(c) for 语 句 
图 3-13 ”计算 不 含 函数 调用 的 循环 语句 的 运行 时 间 

(3) for 语 句 。 如 果 O(f(n)) 是 循环 体 运行 时 间 的 上 界 ， 且 g(n) 是 循环 次 数 的 上 界 ， 那 么 for 
语句 运行 时 间 的 上 界 就 是 O((1+f(n)+1)g(n)) 。 因 子 f(n)+1 表 示 每 进行 一 次 循环 所 花 的 时 间 。 
开头 的 “1+” 表 示 第 一 次 初始 化 , 以 及 第 一 次 测试 为 负 从 而 导致 循环 体 不 执行 这 种 可 能 。 在 f(n) 
和 g(n) 都 至 少 为 1， 或 者 可 重新 定义 为 至 少 是 1 的 一 般 情况 下 ，for 语 句 的 运行 时 间 是 
O(f(n)g(n)) ， 如 图 3-13c 所 示 。 

(4) 选择 语句 。 如 果 O(LAGOD) 和 OUPOD) 分 别 是 if 部 分 和 else 部 分 的 运行 时 间 〈 如 果 没 有 
else 部 分 , 则 O( 广 CD)) 为 0), 那么 选择 语句 运行 时 间 的 上 界 就 是 O(1+max (fi(n), (2))) 。“1+” 
表示 条 件 测试 ， 在 f(n) 和 万 (0) 至 少 有 一 个 为 正 数 的 一 般 情况 下 ， 这 个 “1+” 是 可 以 忽略 的 。 
此 外 ， 如 果 0o) 和 万 (0) 中 有 一 个 是 另 一 个 的 大 0,， 那 么 该 表达 式 如 3.5 节 习题 (3) 中 所 述 那样 可 
以 简化 为 二 者 中 的 较 大 者 。 图 3-14 表 示 了 it 语句 运行 时 间 的 计算 。 











OC(max(fi(n), £(n)) 
或 
O00D) 或 Ap(m) 的 较 大 者 ) 








OU (Wm) OW,(n)) 
图 3-14 ”计算 不 含 函数 调用 的 if 语 句 的 运行 时 间 
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(5) 程序 块 。 如 果 程 序 块 中 各 语句 的 运行 时 间 上 界 分 别 是 O(f(m)) 、O(UAOD) 、…、 
O(f.(m)) ， 那 么 整个 程序 块 运行 时 间 的 上 界 就 是 O(/(n)+ 万 0D)+…+ 大 0D) 。 如 果 可 能 的 话 ， 
请 使 用 求 和 规则 简化 这 个 表达 式 。 程 序 块 运行 时 间 的 计算 规则 如 图 3-15 所 示 。 


CCACD) 
O(£(n)) O(f HD +AN)) 
或 
O(f(n) 的 最 大 者 ) 


和 OGACD) ， 


图 3-15 ”计算 不 含 函 数 调用 的 程序 块 的 运行 时 间 


可 以 应 用 这 些 规 则 ， 从 较 小 的 语句 开始 向 上 遍历 表示 复合 语句 构造 的 结构 树 。 或 者 ， 可 以 
将 这 些 规 则 的 应 用 视 为 从 递归 依据 所 涵盖 的 简单 语句 开始 ， 逐 步 变 成 更 大 的 符合 语句 ， 在 每 一 
步 应 用 5 种 归纳 规则 中 任意 一 种 合适 的 规则 。 不管 我 们 怎样 看 待 计算 运行 时 间 上 界 的 过 程 , 都 需 
要 在 分 析 过 组 成 复合 语句 的 所 有 语句 之 后 ， 再 对 复合 语句 加 以 分 析 。 


+ 示例 3.21 

我 们 来 重新 审视 一 下 图 3-11 中 的 排序 程序 ， 它 的 结构 树 如 图 3-12 所 示 。 首 先 ， 已 知 图 3-12 
中 树叶 位 置 的 每 条 赋值 语句 所 花 的 时 间 为 0Q) 。 继续 向 树 的 上 方 行进 , 就 会 遇 到 第 (4) 行 和 第 (5) 
行 的 i£f 语 句 。 从 示例 3.15 中 可 以 回想 起 这 一 复合 语句 所 花 的 时 间 为 O0) 。 

接 下 来 随 着 向 上 遍历 该 树 (或 者 说 从 较 小 语句 向 它们 所 围绕 的 较 大 语句 行进 )， 就 必须 分 
析 第 (3) 行 至 第 (5) 行 的 for 和 循环。 示例 3.14 就 是 完成 这 一 工作 的 ， 从 中 可 得 出 运行 时 间 为 
O(n 一 i--1)。 在 这 里 ,我 们 选择 将 运行 时 间 表 示 为 具有 n 和 i 两 个 变量 的 函数 。 这 一 选择 给 我 们 
带 来 了 一 些 计 算 上 的 困难 ， 而 正如 接 下 来 将 要 看 到 的 ， 其 实 可 以 选择 O(n) 这 个 更 松散 的 上 界 。 
要 以 O0 -1D 作为 边界 ,就 必须 从 图 3-11 的 第 (1) 行 看 出 1 从 不 可 能 有 7 -1 这 么 大 。 因 此 7 -1 
是 严格 大 于 0 的 , 并 主导 0() 。 所 以 , 我 们 不 需要 在 O( -1D 之 外 加 上 初始 化 for 循 环 的 指标 
j 所 花 的 时 间 OU) 。 

现在 到 了 第 (2) 行 至 第 (8) 行 的 程序 块 。 正 如 示例 3.17 中 所 描述 的 ， 该 程序 块 的 运行 时 间 是 对 
应 4 条 赋值 语句 的 4 个 00) 的 和 ， 加 上 第 (3) 至 第 (G5) 行 复合 语句 的 O(n 一 i-1) 。 根 据 求 和 规则 ， 以 
及 我 们 看 出 的 i<n 的 结论 ， 可 以 舍弃 这 些 O(Q)， 留 下 O(n-i-1) 作为 这 个 程序 块 的 运行 时 间 。 

最 后 ， 必 须 考虑 从 第 (1) 行 到 第 (8) 行 的 这 个 for 循 环 。 该 循环 在 3.6 节 中 没有 得 到 分 析 ， 
不 过 我 们 可 以 运用 归纳 规则 (3)。 该 规则 需要 循环 体 ( 也 就 是 第 (2) 行 至 第 (8) 行 ) 的 运行 时 间 
上 界 。 我 们 刚 确定 了 该 程序 块 的 边界 为 O(n-i-1) ,这 展现 了 之 前 从 未 见 过 的 情形 。 尺 管 i 在 
该 程序 块 内 是 个 常量 , 然而 i 是 外 层 for 循 环 的 循环 指标 ,会 随 着 循环 变化 。 因 此 ,我 们 不 能 
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将 边界 O -2D 视 作 该 循环 全 部 迭代 的 运行 时 间 。 好 在 从 第 (1) 行 可 以 看 出 不 会 小 于 0， 所 
以 O(0 -1D 是 O02 -iD 的 上 界 。 此 外 ， 根 据 低 阶 项 不 产生 影响 的 规则 ， 可 以 将 O(0z -1D 简化 
为 OOD 。 

接 下 来 需要 确定 循环 进行 的 次 数 。 因 为 1 是 从 0 到 7 -2 ,所 以 显然 要 循环 n-1 次 。 用 n-1 
乘 上 O(n) ， 便 得 到 O(n?” -n) 。 再 次 舍 去 低 阶 项 ， 就 得 到 O(2 ) 是 整个 选择 排序 程序 的 运行 时 
间 上 界 。 也 就 是 说 ， 选 择 排 序 的 运行 时 间 具 有 二 次 的 上 界 。 该 二 次 上 界 是 可 能 存在 的 最 紧 上 
界 了 ,因为 可 以 证 明 , 如 果 这 些 元 素 一 开始 是 倒序 排列 的 , 那么 选择 排序 就 要 进行 2(2-1)/2 
次 比较 。 

一 如 我 们 将 要 看 到 的 ， 可 以 为 归并 排序 得 出 nlogn 的 运行 时 间 边 界 。 在 实践 中 ， 除 了 对 那 
些小 的 n 值 之 外 ， 归 并 排序 要 比 选择 排序 更 高 效 。 归 并 排序 有 时 比 选择 排序 慢 的 原因 就 在 于 ， 
O(nlogn) 的 上 界 与 选择 排序 的 边界 O(n”) 相 比 , 隐藏 了 一 个 更 大 的 和 常数。 真实 的 情况 是 一 对 交 
又 的 曲线 ， 如 3.3 节 中 的 图 3-2 所 示 。 


3.7.3 ”循环 运行 时 间 更 精确 的 上 家 


我 们 已 经 说 过 ， 要 评估 循环 的 运行 时 间 ， 需 要 找 出 适用 于 循环 每 一 次 迭代 的 统一 边界 。 
不 过 ,对 循环 更 为 细致 的 分 析 要 分 开 处 理 每 次 迭代 ， 并 为 每 次 迭代 的 上 界 求 和 。 从 技术 上 讲 ， 
必须 将 递增 循环 指标 ( 如 果 循 环 是 fo 循环 ) 和 测试 循环 条 件 的 时 间 包 括 在 内 ,以 防 出 现 操 作 
的 时 间 能 引起 决定 性 变化 的 罕见 情况 。 一 般 来 讲 ， 更 加 细致 的 分 析 并 不 会 改变 答案 ， 虽 然 在 
一 些 不 寻常 的 循环 中 大 多 数 迭 代 只 花费 很 少时 间 , 而 一 次 或 几 次 迭代 却 占据 大 量 运 行 时 间 ( 这 
会 使 这 种 循环 每 次 欠 代 时 间 之 和 ， 要 明显 小 于 迭代 次 数 乘 上 每 次 迭代 可 能 花 的 最 大 时 间 
的 积 )。 
+ 示例 3.22 

我 们 要 对 选择 排序 的 外 层 循环 进行 这 种 更 精确 的 分 析 。 尺 管 付出 了 额外 的 努力 ， 可 还 是 会 
得 到 二 次 的 上 界 。 正 如 示例 3.21 所 示 ， 当 指标 变量 i 的 值 为 i 时， 外 层 循 环 此 次 迭代 的 时 间 为 
OUw-;i-1D 。i 的 范围 是 0 到 -2， 因此 所 有 适 代 所 花 时 间 的 上 界 就 是 O(n-i-D))。 这 个 
和 式 中 所 有 项 形成 了 一 个 算术 级 数 ,所 以 可 以 利用 公式 “第 一 项 和 最 后 一 项 的 平均 数 乘 以 项 数 ”。 
该 公式 告诉 我 们 : 























n—2 
> -i-l)=n(n-D)/2=0.5n? —0.5n 
i=0 


忽略 低 阶 项 和 常数 因子 ， 可 以 看 到 0(0.5n? -0.5n) 与 O(n”) 是 相同 的 。 这 样 就 再 次 得 出 了 结论 : 
选择 排序 具有 二 次 的 运行 时 间 上 界 。 

示例 3.21 中 的 简单 分 析 与 示例 3.22 中 更 细致 分 析 的 区 别 如 图 3-16 所 示 。 在 示例 3.21 中 ， 将 任 
一 次 迭代 可 能 花费 的 最 大 时 间 当 作 每 次 欠 代 的 时 间 , 因此 得 到 了 长 方形 的 区 域 作为 图 3-11 中 for 
循环 运行 时 间 的 边界 。 在 示例 3.22 中 ， 通 过 图 中 的 对 角 线 为 每 次 迭代 确定 了 运行 时 间 边 界 ， 因 
为 每 次 迭代 的 时 间 是 随 着 北 性 递减 的 。 因此， 可 以 得 出 该 三 角形 的 面积 以 作为 对 运行 时 间 的 估 
计 。 不 过 ,众所周知 ， 图 中 三 角形 的 面积 是 长 方形 面积 的 一 半 。 因 为 常数 因子 2 与 其 他 被 大 O 表 
示 法 隐藏 的 常数 因子 一 样 会 消失 ， 所 以 这 两 个 运行 时 间 上 界 其 实 是 一 样 的 。 
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7 一] 





每 次 进 代 
的 时 间 


i 的 值 
图 3-16 ”对 循环 运行 时 间 的 简单 估算 和 精确 估算 
3.7.4 ”习题 
(1) 图 3-17 中 的 C 语 言 程 序 会 计算 数组 AT[0. .n-1] 中 各 元 素 的 平均 值 ， 并 将 最 接近 该 平均 值 的 元 素 的 
下 标 打 印 出 来 ( 若 不 止 有 一 个 这 样 的 元 素 ， 则 以 先 出 现 的 为 准 ) 。 假 设 n 宇 1 ， 而 且 不 含 对 空 数 


组 的 必要 检测 。 画 出 结构 树 ， 展 示 这 些 语句 是 如 何 进一步 组 成 更 复杂 的 语句 的 ， 并 给 出 该 结构 树 
中 每 一 语句 运行 时 间 的 简单 大 O 上 界 和 紧 大 O 上 界 。 整 个 程序 的 运行 时 间 是 多 少 ? 











#include <stdio.h> 
#define MAX 100 
int A[MAX]; 


main() 

{ 
int closest, i, n; 
float avg, sum,; 


(1) for (n= 0; n < MAX && scanf ("%d", &A[n]) != EOF; n++) 
(2) ; 
(3) sum = 0; 
(4) for (i = 0; i < n; i++) 
(5) sum += A[i]; 
(6) avg = sum/n; 
(7) closest = 0; 
(8) 于 二 
(9) While (i < n) { 
/* 在 下 面 的 测试 中 为 元 素 求 平方 ， 就 不 再 
需要 区 分 正 数 和 负数 的 差异 了 。*/ 
(10) if ((A[i]-avg)*(A[i]-avg) < 
(A[closest]-avg)*(A[closest]-avg)) 
(11) closest = i; 
(12) i+t+; 
} 
(13) printf("%d\n",closest); 





图 3-17 ”习题 (1) 的 程序 
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(2) 图 3-18 所 示 的 程序 段 会 将 nxn 的 矩阵 A 变 形 。 画 出 该 程序 段 的 结构 树 ， 给 出 每 一 复合 语句 运行 时 
间 的 大 O 上 界 。 
(a) 用 n 和 i 的 函数 表示 两 个 内 层 循环 运行 时 间 的 边界 。 
(b) 用 n 的 函数 表示 所 有 循环 运行 时 间 的 边界 。 
对 整个 程序 ， 你 的 答案 和 (a)、(b) 部 分 之 间 是 否 存 在 大 O 差 异 ? 








for (i = 0; i < n-i1; i++) 
for (j = i+i; j < n; j++) 


(1) 
(2) 
(3) for (Kk = i; k < n; k++) 
(4) 


ALj][k] = A[j] [Lk] - ALi][k]*A[j] [i]/A[i] [il]; 





图 3-18 ”习题 (2) 的 程序 


(3) * 图 3-19 中 的 程序 段 对 范围 从 1 到 n 的 整数 应 用 了 示例 3.8 中 讨论 的 “2 的 乘 方 ” 操 作 。 夯 出 该 程序 
段 的 结构 树 ， 给 出 每 一 复合 语句 运行 时 间 的 大 O 上 界 。 
(a) 用 i 的 函数 表示 该 while 循 环 运 行 时 间 的 边界 。 
(b) 用 n 的 函数 表示 该 while 循 环 运 行 时 间 的 边界 。 
对 整个 程序 ， 你 的 答案 和 (a)、(b) 部 分 之 间 是 否 存 在 大 O 差 异 ? 











(1) for (i= 1; i <= ni i++) { 
(2) m= 0; 
(3) ji 
(4) while (jh2 == 0) { 
(5) 2 
(6) m++; 
} 
} 








图 3-19 ”习题 (3) 的 程序 


(4) 图 3-20 中 的 函数 会 确定 参数 n 是 否 为 质数 。 请 注意 ， 如 果 n 不 是 质数 ， 它 就 可 以 被 某 个 在 2 和 Vn 之 
间 的 整数 整除 。 画 出 该 函数 的 结构 树 ， 用 n 的 函数 表示 每 一 复合 语句 运行 时 间 的 大 O 上 界 。 整 个 
函数 的 运行 时 间 又 是 多 少 ? 

















int prime(int n) 


{ 
int i; 
(1) i = 2; 
(2) While (i*i <= n) 
(3) if (n%i == 0) 
(4) return FALSE; 
else 

(5) i++; 
(6) return TRUE ; 

} 





图 3-20 “习题 (4) 的 程序 
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3.8 ” 含 函 数 调用 的 程序 的 分 析 


现在 要 展示 的 是 如 何 分 析 包 含 函 数 调用 的 程序 或 程序 段 的 运行 时 间 。 首 先 ， 如 果 所 有 的 函 
数 都 是 非 递归 的 ， 可 以 从 那些 不 调用 其 他 函数 的 函数 开始 ， 每 次 确定 一 个 组 成 该 程序 的 函数 的 
运行 时 间 ， 然 后 为 那些 “只 调用 已 确定 运行 时 间 的 函数 ”的 函数 评估 运行 时 间 。 我 们 以 这 种 方 
式 继续 评 佑 ， 直 到 评估 完 所 有 函数 的 运行 时 间 。 

不 同 函 数 可 能 有 不 同 的 输入 大 小 的 自然 量度 , 这 一 事实 带 来 了 一 些 复杂 性 。 在 一 般 情 况 下 ， 
画 数 的 输入 就 是 该 函数 的 参数 列表 。 如 果 函 数 F 调 用 了 函数 C， 就 必须 将 函数 G 中 参数 的 大 小 量 
度 与 函数 F 所 使 用 的 大 小 量度 联系 起 来 。 这 里 很 难 给 出 实用 的 通则 ， 不 过 本 节 和 下 一 节 中 的 一 
些 示例 将 有 助 于 我 们 了 解 简单 情况 下 为 函数 确定 运行 时 间 边 界 的 过 程 是 怎样 的 。 

假设 已 经 确定 ,函数 F 运 行 时 间 的 良好 上 界 是 O(h(n)) , 其 中 n 是 函数 F 参 数 大 小 的 度量 。 那 
么 在 某 条 简单 语句 ( 比如 一 条 赋值 语句 ) 中 对 进行 调用 时 ， 就 要 将 O(h(n)) 的 开销 加 到 那 条 语 
名 的 运行 时 间 中 。 

当 上 界 为 O(h(n)) 的 函数 出 现在 while 语 句 、gdo-while 语 句 或 if 语 句 的 条 件 中 ,或 出 现在 
for 语 句 的 初始 化 、 测 试 或 重 初始 化 中 时 ， 该 函数 调用 的 时 间 是 按 如 下 方法 计算 的 。 

(1) 如 果 函 数 调用 是 在 while 循 环 或 ao-while 循 环 的 条 件 中 ， 或 在 for 循 环 的 条 件 或 重 初始 
化 中 , 那么 就 要 在 每 次 迭代 的 时 间 边界 上 加 上 h(n) , 然后 按照 3.7 节 中 获取 循环 运行 时 间 的 方式 
继续 下 去 。 

(2) 如 果 函 数 调用 是 在 for 循 环 的 初始 化 中 ， 就 在 循环 的 时 间 开 销 上 加 上 O(h(n))。 

(3) 如 果 函 数 调用 是 在 if 语 句 的 条 件 中 ， 就 在 该 语句 的 时 间 开 销 上 加 上 h(n) 。 

















出 





简 述 程序 分 析 

大 家 应 该 从 3.7 节 和 3.8 节 中 了 解 到 的 主要 观点 如 下 。 

口 一 系列 语句 的 运行 时 间 就 是 每 一 条 语句 运行 时 间 的 和 。 通常 ， 如 果菜 一 语句 的 运行 时 间 
至 少 与 其 他 语句 一 样 大 ， 那 么 它 就 可 以 主导 其 他 语句 。 根据 求 和 规则 ,主导 语句 的 运行 
时 间 就 是 这 一 系列 语句 的 大 O 运 行 时 间 。 

口 要 计算 循环 的 运行 时 间 ， 先 要 将 循环 体 的 时 间 与 各 控制 步骤 ( 比如 重 初始 化 for 循 环 的 
循环 指标 并 将 其 与 上 限 相 比较 ) 的 运行 时 间 相 加 。 用 这 个 时 间 去 乘 以 循环 迭代 次 数 的 上 
界 。 接 着 ， 将 那些 一 次 性 完成 的 步骤 ( 比如 初始 化 或 第 一 次 终止 测试 ) 的 时 间 加 上 ， 以 
防 循环 迭代 0 次 的 情况 出 现 。 

口 选择 语句 (例如 if-else 语 名 ) 的 运行 时 间 是 决定 执行 哪个 分 支 所 花 的 时 间 与 各 分 支 运 
行 时 间 中 较 大 的 那个 相 加 而 得 到 的 之 和 。 





+ 示例 3.23 

让 我 们 分 析 一 下 图 3-21 中 的 (无 意义 的 ) 程序 。 首 先 ， 你 会 注意 到 这 不 是 一 个 递归 程序 。 
majin 困 数 会 调用 foo 国 数 和 ba 图 数 , 而 且 foo 也 数 会 调用 bar 也 数 , 不 过 这 就 是 全 部 的 调用 关 
系 了 。 图 3-22 所 示 的 网 称 为 调用 图 ， 表 示 图 数 调 用 其 他 函数 的 方式 。 因 为 网 中 不 含 循 环 ， 所 以 
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程序 中 没有 递归 调用 ,而且 可 以 首先 从 “第 0 组 ”( 就 是 不 调用 其 他 函数 的 函数 ， 在 本 例 中 就 是 
ba 函数 ) 开始 分 析 这 些 函 数 ， 接 着 处 理 “ 第 1 组 ”( 就 是 只 调用 第 0 组 中 函数 的 函数 ， 在 本 例 中 
就 是 f00 函 数 ) 再 处 理 “ 第 2 组 ”( 就 是 只 调用 第 0 组 和 第 1 组 中 函数 的 函数 , 在 本 例 中 就 是 main 
函数 )。 至此， 工作 就 完成 了 ， 因 为 所 有 的 函数 都 已 经 被 分 组 了 。 在 一 般 情 况 下 ,可 能 要 考虑 分 
更 多 的 组 ， 不 过 只 要 其 中 不 含 循环 ， 最 终 就 能 将 每 个 函数 都 放 在 一 个 组 别 中 。 


#include <stdio.h> 
int bar(int x, int n); 
int foo(int x, int n); 


main() 
{ 


int a, n; 


scanf ("%d", &n); 
a = foo(0,n) ; 
printf("%d\n", bar(a,n)); 


} 


int bar(int x, int n) 
{ 


int 1i; 


for (i = 1; i <= n; i++) 
这 
return Xx; 


} 


int foo(int x, int n) 
{ 


int i; 


for (i = 1; i <= n; i++) 
X += bar(i,n); 
return XxX; 








图 3-21 ”展示 非 递归 函数 调用 的 程序 


图 3-22 ”图 3-21 所 示 程 序 的 调用 图 
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我 们 分 析 函 数 运行 时 间 的 顺序 ， 也 就 是 为 了 理解 该 程序 的 行为 而 对 其 进行 研究 的 顺序 。 因 
此 ， 首 先 考 虑 一 下 bazr 函 数 是 做 什么 的 。 第 (4) 行 和 第 (5) 行 的 for 循 环 会 将 从 1 到 m 的 这 wz 个 整数 都 
加 到 x 上 ， 结 果 就 是 bar(x,n) 等 于 x+ >》 1。 这 里 的 和 式 > i 又 是 个 为 算术 级 数 求 和 的 例子 ， 
只 要 将 第 一 项 与 最 后 一 项 相 加 , 乘 以 项 数 , 然后 再 除 以 ? 即 可 。 也 就 是 > 1i= (1+n)n/2。 因 此 ， 
bar(x,n)=x+(l+n)n/2.。 

现在 ， 考 虑 一 下 foo 函 数 ， 它 会 给 它 的 参数 x 加 上 和 式 


y por 人 站 
i=] 


根据 我 们 对 bar 隐 数 的 了 解 可 知 ，bar(i,n)=i+n(n+]1)/2。 因 此 ，foo 了 所 数 就 是 给 x 加 上 了 
> (itn(n+1)/2) 这 个 量 。 这 样 就 要 为 男 一 个 算术 级 数 求 和 了 , 而 这 个 算术 级 数 需 要 更 多 的 代 
数 变 换 。 不 过 ,读者 可 以 验证 一 下 ，foo 函 数 加 到 x 上 的 这 个 量 就 是 (n+2n? +n)/2。 

最 后 看 看 main 浮 数 。 我 们 在 第 (1) 行 变 入 n, 在 第 (2) 行 将 foo 应 用 到 0 和 nn 上。 根据 我 们 对 foo 
国 数 的 理解 ， 第 (0) 行 foo(0,n) 的 值 就 是 0 加 上 (+2n +n)/2 。 在 第 (3) 行 ， 要 将 
bar (foo (0,n),n) 的 值 打 印 出 来 ,根据 我 们 对 bar 函 数 的 理解 ,这 就 是 n(n+1)/2 与 foo (a,n) 
当前 值 的 和 。 因 此 ， 要 打印 的 值 就 是 (n+2n? +n)/2。 

现在 来 分 析 图 3-21 所 示 程 序 的 运行 时 间 ， 从 bar 函 数 开 始 ， 到 foo 函 数 ， 再 到 main 函 数 ， 
一 如 我 们 在 示例 3.23 中 所 做 的 那样 。 在 这 种 情况 下， 我们 要 确定 值 n 是 所 有 三 个 孔 数 的 输入 的 大 
小 。 也 就 是 说 ， 即 便 我 们 通常 想 考 虑 函数 所 有 参数 的 “大 小 ”, 但 在 本 例 中 国 数 的 运行 时 间 只 取 
决 于 n。 

要 分 析 bar 函 数 ， 先 要 注意 到 第 (9) 行 所 花 的 时 间 为 O0) 。 第 (4) 行 和 第 (5) 行 的 for 循 环 要 适 
代 n 次 , 所 以 第 (4) 行 和 第 (5) 行 的 运行 时 间 是 O(n) 。 第 (6) 行 花 的 时 间 也 是 O() ,所 以 第 (4) 行 至 第 
(6) 行 的 程序 块 的 运行 时 间 是 O(n) 。 

接着 分 析 foo 函 数 。 第 (8) 行 的 赋值 语句 花 的 时 间 是 0() 加 上 调用 bar (i,n) 所 用 的 时 间 。 
而 我 们 已 经 知道 ， 该 调用 花 的 时 间 为 O(n) ， 所 以 第 (8) 行 的 运行 时 间 就 是 O(n) 。 第 (7) 行 和 第 (8) 
行 的 for 循 环 要 迭代 z 次 ， 所 以 可 以 用 循环 体 的 运行 时 间 O(n) 乘 上 循环 迭代 的 次 数 x， 得 到 调用 
foo 峭 数 的 运行 时 间 是 O(n?) 。 

最 后 来 分 析 main 函 数 。 第 (1) 行 所 花 的 时 间 为 0Q) ， 第 (2) 行 对 foo 国 数 的 调用 所 花 的 时 间 
为 Om) ， 第 (3) 行 的 打印 语句 所 花 的 时 间 为 0() 加 上 调用 lbar 函 数 所 花 的 时 间 。 而 后 者 所 花 时 
间 为 O(n) ， 所 以 整个 第 (3) 行 所 花 的 时 间 为 0Q)+0O0(n) 。 因 此 从 第 (1) 行 到 第 (3) 行 的 整个 程序 块 
的 运行 时 间 为 OCD+OCO2)+OG+O(CD) 。 根 据 求 和 规则 ， 可 以 消除 第 二 项 之 外 的 所 有 项 ， 得 出 
该 函数 的 运行 时 间 为 0022 ) 。 也 就 是 说 ， 第 (2) 行 对 foo 函 数 的 调用 决定 了 整个 时 间 开 销 。 


























证 明和 对 程序 的 理解 
读者 可 能 注意 到 ， 在 对 图 3-21 所 示 程 序 的 研究 中 ,我 们 能 理解 程序 在 做 什么 ， 却 不 能 像 在 
第 2 章 中 那样 正式 地 证 明 点 什么 。 不 过 ， 在 这 表面 之 下 却 潜藏 着 诸多 简单 的 归纳 证 明 。 例 如 ， 
需要 对 第 (4) 行 和 第 (5) 行 循环 迭代 的 次 数 进行 归纳 ,证 明 在 我 们 用 值 为 i 的 i 开始 迭代 之 前 ，x 的 
值 是 x 的 初始 值 加 上 》，j 。 请 注意 ， 如 果 i=1， 这 个 和 式 不 含 任何 项 ， 则 其 值 会 为 0。 





3.9 ”递归 函数 的 分 析 105 





习题 


(1) 证 明示 例 3.23 中 的 结论 : > _ Git+n(n+D/2)=(n +2n +n)/2。 
(2) 假设 prime (n) 是 运行 时 间 为 O(Vn) 的 函数 调用 。 考 虑 一 下 函数 体 如 下 的 函数 : 
证 ( prime(n) ) 
A; 
else 
B; 
分 别 假设 : 
(a) 4 所 花 的 时 间 为 O(n) ，B 所 花 的 时 间 为 00) ; 
(b) 4 和 8B 所 花 的 时 间 都 为 0() 。 
用 7m 的 函数 表示 出 这 两 种 情况 下 该 函数 运行 时 间 的 简单 大 O 上 界 和 紧 大 O 上 界 。 
(3) 考虑 函数 体 如 下 的 函数 : 
sum = 0; 
for (i = 1; i <= f(n); i++) 
sum += 工 ; 
其 中 f(n) 是 函数 调用 。 分 别 假设 : 
(a) f(n) 的 运行 时 间 是 O(n) ， 而 f(n) 的 值 是 nl; 
(b) f(n) 的 运行 时 间 是 O(n) ， 而 fn) 的 值 是 n; 
(c) f(n) 的 运行 时 间 是 O(n?) ， 而 f(n) 的 值 是 n; 
(d) f(n) 的 运行 时 间 是 0Q) ， 而 fn) 的 值 是 0。 
用 nn 的 函数 表示 出 这 4 种 情况 下 该 函数 运行 时 间 的 简单 大 O 上 界 和 紧 大 O 上 界 。 
(4) 绘 出 2.8 节 归并 排序 程序 中 陶 数 的 调用 图 。 那 个 程序 是 否 为 递归 程序 ? 
(5)* 假设 图 3-21 中 foo 函 数 的 第 (7) 行 被 奉 换 为 
for (i = 1; i <= bar(n,n); i++) 


那么 main 函 数 的 运行 时 间 会 是 多 少 ? 


3.9 ”如 归 函 数 的 分 析 


确定 递归 调用 自身 的 函数 的 运行 时 间 ， 需 要 比分 析 那 些 非 递 归 函 数 耗费 更 多 的 精力 。 北 归 
冰 数 的 分 析 需 要 我 们 将 程序 中 的 每 个 函数 F 与 某 个 未 知 的 运行 时 间 7;(n) 关联 起 来 。 这 一 未 知 的 
函数 将 F 的 运行 时 间 表 示 为 Ff 函数 参数 的 大 小 n 的 函数 。 然 后 构建 一 套 归 纳 定义 , 称 为 7(n) 的 递 
推 关 系 , 将 7T,(n) 与 同一 程序 中 其 他 函数 G 及 其 相应 的 参数 大 小 Kk 表示 的 7,(k) 形式 关 联 起 来 。 如 
果 F 是 直接 递归 的 ， 那么 G 中 至 少 有 一 个 将 与 是 相同 的 。 

7T,(n) 的 值 通常 是 通过 对 参数 大 小 n 的 归纳 取得 的 。 因 此 ， 需 要 选择 合适 的 参数 大 小 ， 保 证 
随 着 递归 的 进行 ， 也 数 在 被 调用 时 所 使 用 的 参数 在 逐渐 减 小 。 这 一 要 求 与 我 们 在 2.9 市 中 试图 证 
明 有 关 递 归程 序 的 命题 时 遇 到 的 要 求 别 无 二 致 。 这 应 该 没什么 可 奇怪 的 ， 因 为 有 关 程 序 运行 时 
间 的 命题 正 是 我 们 可 能 试 着 证 明 的 与 程序 相关 的 某 种 内 容 。 

一 旦 找到 了 合适 的 参数 大 小 ， 就 可 以 考虑 以 下 两 种 情况 了 。 

(1) 参数 大 小 足够 小 ， 使 F 不 进行 递归 调用 。 这 种 情况 对 应 7,(n) 归纳 定义 中 的 依据 。 

(2) 对 于 较 大 的 参数 大 小 ， 将 至 少 会 发 生 一 次 递归 调用 。 请 注意 ， 无论 F 进 行 怎 样 的 递归 调 

用 ,不 管 是 对 其 自身 还 是 对 某 个 其 他 函数 G 进 行 递 归 调 用 ， 都 只 可 能 使 用 更 小 的 参数 。 
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这 种 情况 对 应 7 (n) 归纳 定义 中 的 归纳 步 又 。 

通过 对 函数 F 的 代码 的 研究 ， 并 完成 如 下 操作 ， 可 以 得 出 7,(n) 北 推 关系 的 定义 。 

(a) 对 函数 G 的 每 次 调用 或 表达 式 中 陶 数 G 的 每 次 使 用 ( 请 注意 ，G 可 能 就 是 F), 用 到) 
表示 该 次 调用 的 运行 时 间 ， 其 中 k 是 对 该 次 调用 中 参数 大 小 的 合理 度量 。 

(b) 运 用 前 面 几 节 中 介绍 的 技巧 评估 也 数 F 的 函数 体 的 运行 时 间 ， 不 过 要 将 7T,(k) 这 样 的 
项 留 作 未 知 函数 , 而 不 是 诸如 x 这样 的 具体 函数 。 一般 不 能 用 求 和 规则 这 样 的 简化 技 
巧 把 这 些 项 与 具体 函数 结合 起 来 。 我 们 必须 对 FF 进行 两 次 分 析 ， 一 次 假设 的 参数 大 
小 n 足 够 小 ， 使 得 也 数 未 进行 递归 调用 ， 而 男 一 次 假设 n 不 是 那么 小 。 因 此 ， 我 们 得 
到 了 两 个 表示 Ff 函数 运行 时 间 的 表达 式 。 其 一 ( 依据 表达 式 ) 是 7,(n) 递 推 关系 的 依 
据 ， 男 一 个 ( 归纳 表达 式 ) 则 是 7,(n) 递 推 关 系 的 归纳 部 分 。 

(c) 在 得 出 的 有 关 函 数 F 运 行 时 间 的 依据 表达 式 和 归纳 表达 式 中 , 用 特定 常数 乘 上 有 关 郴 
数 (例如 cf(n) ) 的 形式 来 代 蔡 像 O( 了 (n)) 这样 的 大 O 项 。 

(qd) 如 果 输 入 大 小 的 依据 值 为 4， 令 7T.(a) 是 在 假设 不 存在 递归 调用 的 情况 下 ， 由 步骤 (c) 
得 出 的 依据 表达 式 。 还 有 , 令 7T,(n) 是 从 步骤 (c) 得 到 的 n 值 不 为 依据 值 4 的 情况 下 的 归 
纳 表达 式 。 














int fact(int n) 
{ 
if (Cn <= 1) 


return 1; /* 依据 */ 
else 
return n*fact(n-1); /* 归纳 */ 





图 3-23 ”计算 n! 的 程序 


通过 求解 这 个 递 推 天 系 ， 就 可 以 确定 整个 函数 的 运行 时 间 。 在 3.11 市 中 ， 我 们 将 介绍 一 些 
一 般 性 的 技巧 ， 用 来 在 对 普通 递归 函数 的 分 析 中 求解 这 种 递 推 关 系 。 而 现在 ,我 们 要 通过 特别 
手段 来 求解 这 些 递 推 关系 。 


+ 示例 3.24 

我 们 来 重新 考虑 一 下 2.7 节 中 计算 阶乘 也 数 的 递归 程序 。 因 为 只 涉及 fact 这 一 个 函数 ， 所 
以 使 用 7T(n) 表示 该 函数 未 知 的 运行 时 间 。 我 们 将 使 用 参数 的 值 n 作 为 参数 的 大 小 。 显 然 ， 当 参 
数 为 时 进行 的 fact 消 数 的 递归 调用 ， 要 使 用 更 小 的 参数 ， 准 确 地 说 是 n-1。 

我 们 选择 n=1 作 为 Tln) 归纳 定义 的 依据 , 因为 当 fact 六 数 的 参数 为 1 时 , 它 不 执行 任何 递 
归 调 用 。 当 n=1 时 ,第 (1) 行 的 条 件 为 真 ， 因 此 对 fact 的 调用 会 执行 第 (1) 行 和 第 (2) 行 。 每 一 行 
花 的 时 间 都 是 OQ) ， 所 以 依据 情况 中 fact 的 运行 时 间 为 0Q4) 。 也 就 是 说 7T() 是 0()。 

现在 考虑 当 n>1 时 会 发 生 什么 。 第 (1) 行 的 条 件 为 假 ， 因 此 只 执行 第 (1) 行 和 第 (3) 行 。 第 (1) 行 
花 的 时 间 是 0() , 而 第 (3) 行 会 在 乘法 和 赋值 上 用 掉 0() , 并 在 对 fact 的 递归 调用 上 花费 TUz-D 。 
也 就 是 说 ， 当 >1 时 ，fact 的 运行 时 间 是 O+7TO =-D 。 因 此 可 以 用 以 下 递 推 关 系 定义 7(z) 。 

依据 。7T(D)=0(1)。 

归纳 。 对 n>1，T(n)= O00)+T(n-1)。 

现在 要 引入 一 些 和 常数 符号 来 表示 隐藏 在 各 大 O 表 达 式 中 的 和 常数， 就 像 之 前 在 规则 (c) 中 表述 
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的 那样 。 在 这 种 情况 下 ， 可 以 用 某 个 常数 ae 代 蔡 依据 中 的 OG) ， 并 用 某 个 常数 b 蔡 代 归 纳 中 的 
0() 。 这 些 变 化 给 了 我 们 如 下 的 递 推 关系 。 
依据 。7(D =a 。 
归纳 。 对 n>1，T(n)=b+T(n-1)。 
现在 必须 求解 Two) 的 这 一 递 推 关 系 , 我 们 很 容易 计算 出 靠 前 的 一 些 值 , 由 递 推 依据 7()=a ， 
以 及 归纳 规则 ， 我 们 得 到 
T(2)=b+7T()=a+b 
继续 使 用 归纳 规则 ， 就 得 到 
T(3)=b+7T(2)=b+(a+b)=a+2b 
然后 是 
T(4)=b+7T(3)=b+(a+2b)=a+3b 
至 此 ,不 难 猪 测 ， 对 所 有 的 n 三 1， 有 7T(n)=a+(n-1b。 其 实 ， 计算 一 些 样本 值 ， 接 着 猿 测 解 
决 方案 ， 并 最 终 通过 归纳 法 证 明 猜 测 正确 ， 这 就 是 我 们 常用 来 处 理 递 推 关 系 的 方法 。 
不 过 ,在 这 个 例子 中 ,我 们 可 以 使 用 反复 代 换 (repeated substitution ) 的 方法 直接 得 出 解决 
方案 。 首 先 ， 在 递归 等 式 中 进行 如 下 变量 代 换 ， 用 m 替 换 n， 就 得 到 
对 m>1 ，T(m)=b+T(m-]) ( 3.3) 
现在 ， 可 以 用 z、7m -1 、7=-2 、…、2 蔡 换 等 式 (3.3) 中 的 m， 得 到 一 系列 的 等 式 
(1) T(xn) =b+7T(n—1) 
(2) T(n-D)=b+T(n—2) 
(3) T(x—2)=b+T(n—3) 


n-l) 7(2) =p+7O) 
接 下 来 ， 可 以 利用 上 述 系 列 等 式 中 的 第 (2) 行 ， 来 蔡 换 第 (1) 行 中 的 7T(n-1) ， 从 而 得 到 等 式 
T(n)=b+(b+T(n-2))=2b+7T(n—2) 
现在 用 第 (3) 行 替换 上 式 中 的 Tn-2) ， 就 得 到 
T(n)=2b+(b+T(n—3))=3b+T(n—3) 
按 这 种 方式 继续 下 去 ， 次 都 将 7T(n) 一 替换 为 p+7W -iD ， 直 到 向 下 达到 7(Q)。 至 此 ， 就 
得 到 了 等 式 





T(n) =(n-1) b+7() 
接着 可 以 利用 依据 ， 用 a 替换 7T(1) ， 就 可 以 得 到 7T(n)=a+(n-1b。 

如 果 想 让 该 分 析 过 程 更 正式 ， 就 需要 通过 归纳 法 ， 对 我 们 在 反复 对 7(n-i) 进行 蔡 换 时 的 直 
观 观 察 结果 加 以 证 明 。 因 此 ， 我 们 要 通过 对 i; 的 归纳 证 明 如 下 命题 。 

命题 SQ) 。 如 果 1 三 i 三 n， 那么 T(n)=ib+T(n-i)。 

依据 。 依 据 为 i=1，SQ) 是 说 T(n)=5+7T(n-1)。 这 是 对 7T(n) 的 定义 中 的 归纳 部 分 ， 因 此 
EN 

归纳 。 如 果 i 三 n-1， 就 没什么 要 证 明 的 ， 因 为 命题 S(i+D) 的 开头 是 “如 果 1i+t1 志 nn”， 
而 当 i£ 语 句 的 条 件 为 假 时 ,不管 “那么 ”后 面 是 如 何 表 述 的 ， 该 命题 都 为 真 。 在 这 种 情况 下 ， 
若 i 三 n-1， 则 条 件 i+1<n 一 定 为 假 。 所 以 S(i+]1) 一 定 为 真 。 

难点 就 在 于 ， 当 i 万 n-2 的 时 候 。 在 这 种 情况 下 ，5SQ) 就 是 7T(n)=ibp+7T(n-i)。 因 为 
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i 三 n-2 ， 所 以 TCD 的 参数 至 少 为 2。 因 此 可 以 将 该 归纳 规则 应 用 到 ZE ， 也 就 是 用 六; 替换 
等 式 (3.3) 中 的 m， 从 而 得 出 等 式 T(n-- 站 =bp+7T(n -iD 。 当 我 们 用 b+7T(n-i-1) 替换 掉 等 式 
T(n)= 认 +7T(n 一 让 中 的 7T(n-i) 时， 就 得 到 7(n)=ib+(bp+7(n--i-1)) ， 重 组 这 些 项 就 得 到 
T(n)=(i+Db+T(n-(i+))) 

这 个 等 式 就 是 命题 S(i+1) ， 而 且 我 们 现在 已 经 证 明了 归纳 步 又。 

现在 已 经 证 明了 7(n) =a+(n-1)b 。 不 过 ，a 和 8 都 是 未 知 的 常数 。 因 此 ， 这 样 表示 解决 方 
案 是 不 行 的 。 不 过 ,可 以 将 7T(n) 表示 为 m 的 多 项 式 ， 即 加 +(a- 思 ， 接 着 再 用 大 0 表达 式 来 替代 
这 些 项 ， 就 得 到 了 O(n)+ O00) 。 利 用 求 和 规则 ,还 可 以 消 掉 O() ， 从 而 得 出 7T(n) 是 O(n) 。 这 就 
有 意义 了 , 它 表示 : 要 想 计算 n!， 就 要 利用 对 fact 的 n 次 (实际 调用 次 数 刚好 为 n ) 调用 的 顺序 ， 
其 中 每 次 调用 所 需 时 间 为 00) ， 不 计 入 花 在 执行 对 fact 的 递归 调用 上 的 时 间 。 


习题 

(1) 为 2.9 节 习题 (2) 中 提 到 的 sum 函 数 ( 它 是 作为 程序 输入 的 表 的 长 度 的 函数 ) 的 运行 时 间 建 立 递 推 关 
系 。 请 用 (未 知 的 ) 常数 替换 大 0 项 ， 并 试 着 求解 这 种 递 推 关 系 。sum 的 运行 时 间 是 多 少 ? 

(2) 对 2.9 节 习题 (3) 中 提 到 的 Einq0 函 数 重复 习题 (1D) 中 的 练习 。 合 适 的 大 小 量度 是 什么 ? 

(3)* 对 2.7 节 中 图 2-22 所 示 的 选择 排序 程序 重复 习题 (1) 中 的 练习 。 合 适 的 大 小 量度 是 什么 ? 

(4) ** 对 图 3-24 中 的 函数 重复 习题 (1D) 中 的 练习 ， 该 函数 是 计算 斐 波 那 契 数 的 (最 开始 的 两 个 数 是 1， 
之 后 的 每 个 数 都 是 其 前 两 个 相 邻 数字 之 和 。 前 7 个 斐 波 那 契 数 分 别 是 1、1、2、3、5、8、13 ) 。 
请 注意 ，z 的 值 是 合适 的 参数 大 小 ， 而 且 大 家 需要 使 用 1 和 2 作为 依据 情况 。 








int fibonacci(int n) 


{ 
if (n <= 2) 
return 1; 
else 
return fibonacci(n-1) + fibonacci(n-2); 
} 





图 3-24 “计算 斐 波 那 契 数 的 C 语 言 函 数 


(5)* 编写 递归 程序 计算 gca (i,j)， 就 是 两 个 整数 :和 j 的 最 大 公约 数 ， 如 2.7 节 习题 (8) 中 概述 的 那样 。 
证 明 该 程序 的 运行 时 间 是 O(logi) 。 提 示 : 在 我 们 调用 gcd (m,n) 两 次 后 证 明 这 一 点 (其 中 


mi/2 ) 。 


3.10 ”归并 排序 的 分 析 


我 们 现在 要 分 析 2.8 节 中 介绍 过 的 归并 排序 算法 。 首 先 要 证 明 , merge 国 数 和 sp1it 上 因数 在 
处 理 长 度 为 n 的 表 时 ， 所 花 的 时 间 都 是 O(n) ; 接着 使 用 这 些 边界 来 证 明 Mergesort 哺 数 在 处 理 
长 度 为 z 的 表 时 所 花 的 时 间 为 O(nlogn) 。 


3.10.1 _ merge 上 国 数 的 分 析 


首先 分 析 递 归 函 数 merge， 我 们 在 图 3-2$ 中 再 次 展示 了 它 的 代码 。merge 困 数 参 数 大 小 m 
的 合适 概念 是 表 1ist1 和 1ist2 的 长 度 之 和 。 因 此 ， 设 7(n) 是 当 参 数 表 的 长 度 之 和 为 nz 时 merge 


3.10 ”归并 排序 的 分 析 109 





函数 所 花 的 时 间 。 我 们 可 以 拿 n=1 的 情况 作为 依据 情况 ， 因 此 必须 在 listl 和 1ist2 二 者 中 有 
一 个 为 空 而 男 一 个 仅 含 一 个 元 素 的 假设 下 对 图 3-25 进 行 分 析 。 有 以 下 两 种 情况 。 

(1) 如 果 第 () 行 的 测试 (也 就 是 1ist1 等 于 NULIL 的 测试 ) 成 功 ， 我 们 就 返回 1ist2， 这 所 
花 的 时 间 为 O() 。 第 (2) 行 至 第 (7) 行 就 不 会 执行 。 因 此 ， 整 个 函数 调用 所 花 的 时 间 为 测试 第 (1) 
行 选择 的 O0) 和 执行 第 (1) 行 赋值 的 OQ) ， 总 共 是 0(1) 。 

(2) 如 果 第 (1) 行 的 测试 失败 ， 就 说 明 1ist1i 不 为 空 。 因 为 我 们 假设 两 个 表 的 长 度 之 和 只 是 1， 
所 以 1ist2 一 定 为 空 。 因 此 ， 第 (2) 行 的 测试 ( 即 1ist2 等 于 NULL 的 测试 ) 一 定 会 成 功 。 那 么 我 
们 就 要 花 00) 来 执行 第 (1]) 行 的 测试 ， 花 00) 执行 第 (2) 行 的 测试 ， 再 花 O0) 在 第 (2) 行 返回 
list1。 第 (3) 行 至 第 (7) 行 不 会 执行 。 所 花 的 时 间 还 是 0() 。 

这 样 可 以 得 出 在 依据 情况 中 merge 的 运行 时 间 为 0(1) 。 





LIST merge(LIST listi, LIST list2) 
{ 


if (list1 == NULL) return list2; 

else if (list2 == NULL) return listt; 

else if (list1i->element <= list2->element) { 
listi->next = merge(list1i->next, list2); 


return listi; 
} 
else { /* 1ist2 的 第 一 个 元 素 更 小 */ 
list2->next = merge(list1i, list2->next); 
return list2; 
} 
} 





图 3-2$ merge 国 数 
现在 来 考虑 归纳 情况 , 也 就 是 表 长 度 之 和 大 于 1 的 情况 。 当 然 , 即便 长 度 之 和 为 2 或 者 更 大 ， 


仍然 可 能 有 一 个 表 为 空 。 因 此 ,， 骸 套 的 选择 语句 所 表示 的 4 种 情况 都 可 能 发 生 。 图 3-25 中 程序 的 
结构 树 如 图 3-26 所 示 。 我 们 可 以 从 结构 树 的 底部 开始 ， 向 上 分 析 该 程序 。 












和 下 
(GD-O) 





程序 块 程序 块 
(6)-(7) 





图 3-26” merge 的 结构 


最 内 层 的 选择 是 从 第 (3) 行 的 “if” 开 始 的 ， 我 们 在 那里 会 测试 哪个 表 的 第 一 个 元 素 更 小 ， 
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并 根据 测试 的 结果 选择 执行 第 (4) 行 和 第 (3) 行 ， 或 执行 第 (6) 行 和 第 (7) 行 。 第 (3) 行 的 条 件 需要 花 
00) 的 时 间 来 评估 ， 第 (39) 行 要 花 上 0() 来 评 佑 ， 而 第 (4) 行 所 花 的 时 间 是 Cd) 加 上 递归 调用 
merge 所 花 的 时 间 7T(n-7)。 请 注意 ，n -1 是 递归 调用 的 参数 大 小 ， 因 为 我 们 已 经 从 一 个 表 中 易 
除了 一 个 元 素 , 并 保持 另 一 个 表 不 变 。 因此 第 (4) 行 和 第 (5) 行 的 程序 块 所 花 的 时 间 为 0Q)+7T(n-1)。 

对 第 (6) 和 第 (7) 行 中 else 部 分 的 分 析 是 完全 一 样 的 : 第 (7) 行 所 花 时 间 为 0Q) ， 而 第 (6) 行 所 
花 时 间 为 0(D)+7T(n-1) 。 因 此 ,在 选取 if 部 分 和 和 else 部 分 运行 时 间 的 最 大 值 时 , 会 发 现 这 两 者 
其 实 是 相同 的 。 测 试 条 件 所 花 的 时 间 00) 可 以 忽略 ， 因 此 可 以 得 出 结论 : 最 内 层 选择 的 运行 时 
间 是 OQ)+7T(n-1) 。 

现在 继续 分 析 从 第 (2) 行 开始 的 选择 。 我 们 要 在 这 一 行 测试 list2 是 否 等 于 NULL。 测试 条 件 
的 时 间 为 0Q) ， 而 if 部 分 的 时 间 ( 就 是 第 (2) 行 的 返回 ) 也 是 0() 。 不 过 ，else 部 分 是 第 (3) 
行 至 第 (7) 行 的 选择 语句 ， 这 部 分 语句 的 运行 时 间 我 们 刚才 确定 过 了 ， 是 O(1)+7(n-1)。 因 此 ， 第 
(2) 行 至 第 (7) 行 的 选择 所 花 的 时 间 为 

O() + max (0(1), O00) +T(n-1)) 

最 大 值 中 的 第 二 项 主导 了 第 一 项 ， 也 主导 了 测试 条 件 所 花 的 时 间 0() 。 因 此 ， 从 第 (2) 行 开始 的 
if 语 句 的 运行 时 间 也 是 0(1)+7T(n-1)。 

最 后 ， 要 对 最 外 层 的 1£ 语 句 进 行 同样 的 分 析 。 从 根本 上 讲 ， 对 时 间 起 主导 作用 的 还 是 由 第 
(2) 行 至 第 (7) 行 组 成 的 else 部 分 的 时 间 。 




















递归 的 共通 形式 
很 多 极 简单 的 递归 函数 (比如 fact 和 metrge ) 都 会 执行 一 些 所 需 时 间 为 O(D 的 操作 ， 然 
后 对 它们 自己 执行 参数 大 小 减 小 1 的 递归 调用 。 假 设 依据 情况 花 的 时 间 为 O0) ， 可 以 看 到 这 样 
的 函数 总 能 形成 T(n) = OU)+T7(2 -ID 这样 的 递 推 关 系 。7Uo) 的 解 是 O(n) ， 或 者 是 参数 大 小 的 
线性 关系 。 在 3.11 节 中 我 们 还 将 看 到 对 这 一 原则 的 一 些 概括 。 





也 就 是 说 ,这些 含 递归 调用 的 情况 ( 比如 第 (4) 行 和 第 (5) 行 ， 或 第 (0) 行 和 第 (7) 行 ) 下 的 时 间 ， 
主导 了 不 含 递归 调用 情况 下 的 时 间 , 还 主导 了 第 (1)、(2) 和 (3) 行 中 所 有 3 次 测试 的 时 间 。 因 此 , 当 n>1 
时 ,merge 函 数 的 运行 时 间 上 界 就 是 O(D+7( -1D 。 因 此 可 以 得 到 用 于 定义 7T(n) 的 如 下 递 推 关系 。 

依据 。7()= OO 。 

归纳 。 对 n>1，T(n)= O00D)+T(n-1)。 

这 些 等 式 与 示例 3.24 中 为 fact 消 数 得 出 的 那些 等 式 如 出 一 辐 。 因 此 ， 求 解 过 程 是 相同 的 ， 
可 以 得 出 7T(n) 是 O(n) 的 结论 。 该 结果 从 直观 上 讲 是 成 立 的 , 因为 merge 函 数 的 工作 原理 就 是 花 
O0U) 的 时 间 从 其 中 一 个 表 里 删除 一 个 元 素 ， 然 后 对 剩余 的 表 递 归 地 调用 自身 。 这 种 递归 调用 遵 
循 着 递归 调用 的 次 数 不 大 于 表 长 度 之 和 的 原则 。 如 有 果 不 考虑 其 递归 调用 所 花 时 间 ， 那 么 每 次 调 
用 均 耗 时 0() ， 如 此 就 可 以 得 出 merge 的 运行 时 间 将 会 是 0(n) 。 


3.10.2 split 明 数 的 分 析 


现在 来 考虑 一 下 splLit 函 数 ， 我 们 在 图 3-27 中 再 次 展示 了 该 图 数 。 对 sp1it 函 数 的 分 析 和 
对 merge 函 数 的 分 析 非 常 相 似 。 我 们 令 表 的 长 度 为 参数 的 大 小 m, 而 且 这 里 使 用 Tuwz) 表示 split 
函数 处 理 长 度 为 n 的 表 所 花 的 时 间 。 
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LIST split(LIST list) 


LIST pSecondCell; 


) if (list == NULL) return NULL; 
(2) else if (list->next == NULL) return NULL; 
else {/* 至 少 有 两 个 单元 */ 
) pSecondCell = list->next; 
) list->next = pSecondCell->next; 
) pSecondCell->next = split(pSecondCell->next); 
) return pSecondCell; 








图 3-27 split 函数 

我 们 选取 n=0 和 n=1 作为 依据 。 如 果 n=0， 也 就 是 说 表 为 空 ， 那 么 第 (1) 行 的 测试 就 会 成 
功 ， 而 我 们 将 在 第 (1) 行 返回 NULL。 第 (2) 行 至 第 (6) 行 就 不 会 执行 。 因 此 所 花 的 时 间 为 0Q) 。 如 
果 n=1， 也 就 是 表 只 含 一 个 元 素 ， 那 么 第 (1) 行 的 测试 失败 ， 不 过 第 (2) 行 的 测试 成 功 。 因 此 我 
们 会 在 第 (2) 行 返回 NULL， 而 且 不 执行 第 (3) 行 至 第 (6) 行 。 同 样 ， 这 两 条 测试 语句 和 一 条 返回 语 
句 只 需要 OU) 的 时 间 。 

接着 考虑 n>1 时 的 归纳 部 分 , 这 里 存在 3 条 选择 分 文 , 类 似 我 们 在 分 析 merge 国 数 时 遇 到 的 
4 条 分 支 。 简 单 来 说 ， 可 以 看 出 ， 第 (1) 行 和 第 Q2) 行 的 测试 不 论 是 执行 一 个 还 是 两 者 都 执行 ， 所 
花 时 间 都 是 CO() ， 正 如 我 们 最 终 为 merge 中 数 得 出 的 结论 那样 。 而 且 ， 如 果 这 两 个 测试 中 有 一 
个 为 真 ， 就 会 致使 我 们 在 第 (]) 行 或 第 (2) 行 返回 的 情况 中 ,多 花 的 时 间 也 是 0(1) 。 占 主导 的 时 间 
是 两 个 测试 均 失 败 的 情况 ， 也 就 是 表 长 度 至 少 为 2 的 情况 。 在 这 种 情况 下 ， 第 (3) 行 至 第 (6) 行 的 
语句 都 要 执行 。 除 了 第 (5) 行 的 递归 调用 外 ， 其 他 的 内 容 所 花 的 时 间 为 OO) 。 而 递归 调用 的 时 间 
是 7(z -2) ， 因 为 该 参数 表 是 1ist 原 来 的 值 减 去 它 的 前 两 个 元 素 ( 想 知道 原因 ， 可 以 参考 2.8 市 
中 的 内 容 ， 特 别 是 图 2-28 )。 因 此 ， 归 纳 情 况 下 的 7T(n) 是 0()+7T(n-2)。 

可 以 建立 如 下 递 推 关系 。 

依据 。7(0)= 00),， 且 7()=0()。 

归纳 。 对 n>1 ，T(n)=00)+7T(n-2)。 

如 示例 3.24 所 述 ， 接 下 来 必须 引入 某 些 常数 来 表示 隐藏 在 0() 背后 的 比例 常数 。 可 以 分 别 
用 常数 a 和 b 表 示 依 据 中 7(0) 和 ZW) 的 O() ， 并 用 常数 c 表 示 归 纳 步 又 中 的 OG) 。 因 此 ， 可 以 将 
上 述 递归 定义 重 写 为 

依据 。7(0) =a， 且 7G) =2。 

归纳 。 对 n 三 2，7T(n)=c+7T(n-2)。 

我 们 先 来 求 一 下 7T(n) 的 前 几 个 值 。 由 依据 ， 显 然 有 7(0) = a 和 7T(D)=b。 可 以 使 用 归纳 步骤 
得 出 











7T(2)=c+7(0)=atc 
7(3)=c+7(D=D+c 
T(4)=c+7(2)=c+(at+c)=a+2c 
T(S5)=c+7(3)=c+(b+c)=b+2c 
T(6)=c+7(4)=c+(a+2c)=a+3c 
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对 7T(n) 的 计算 其 实 是 两 部 分 单独 的 计算 ,一 部 分 是 n 为 奇数 的 情况 ,一 部 分 是 n 为 偶数 的 情况 。 对 
偶数 nx， 我 们 有 7T(n)=a+cn/2。 这 是 可 行 的 ， 因 为 对 长 度 为 偶数 的 表 ， 上 吻 除 两 个 元 素 所 花 的 时 间 
为 c<， 而 且 在 经 过 n/2 次 递归 调用 后 ， 就 会 得 到 不 再 对 其 进行 递归 调用 而 且 所 花 时 间 为 a 的 空 表 。 

对 奇数 长 度 的 表 来 说 , 还 是 要 花 时 间 c 来 剔除 两 个 元 素 的 。 在 经 过 (2 -1Dy/12 次 调用 后 , 我 们 
得 到 了 一 个 长 度 为 1 的 表 ， 而 且 需 要 的 时 间 为 5。 因此 ， 奇 数 长 度 的 表 所 需 的 时 间 将 是 
b+c(n—1)/2。 

对 这 些 观察 结果 的 归纳 证 明 与 示例 3.24 中 的 证 明 过 程 非常 近似 ， 就 是 要 证 明 如 下 命题 。 

命题 SG@) 。 如 果 1 三 i 三 n/2 ,那么 T(n)=ic+T(n 一 2i)。 

在 该 命题 的 证 明 过 程 中 ， 我 们 使 用 7(n) 定 义 中 的 归纳 规则 ， 用 参数 m 将 其 重 写 为 
对 m 宇 2, T(m)=c+T(m—2) (3.4) 
接着 就 可 以 按照 如 下 方式 用 归纳 法 证 明 SG) 了。 

依据 。 依 据 是 i=1， 也 就 是 用 n 替 代 m 后 的 等 式 (3.4)。 

归纳 。 因 为 SQ) 是 “如 果 …… 那 么 ……” 的 形式 ， 所 以 和 车 i 三 n/2， 则 S(i+D) 恒 为 真 。 
此 ， 若 i 宇 n/2， 我 们 就 不 需要 对 归纳 步骤 ( 即 由 SQ) 可 得 到 SG+1) ) 加 以 证 明 。 

难点 是 当 1 志 i 记 n/2 时 。 在 这 种 情况 下 ， 假定 归纳 假设 $Q) 为 真 ， 即 7T(n)=ic+T(n 一 2i)。 
用 7 -2 替换 (3.4) 中 的 m， 就 得 到 

T(n—-2i)=c+T(n—2i-2) 
如 果 替 换 8G) 中 的 TO - 25 ， 就 得 到 
T(n)=ic+(c+T(n—2i-2)) 
如 果 对 等 式 右边 的 项 加 以 组 合 ， 就 有 
T(n)=(i+Dc+T(n—2(i+1)) 

这 就 是 命题 S(i+1) 。 因 此 我 们 证 明了 归纳 步 怠 ， 而 且 得 出 7T(n)=ic+7T(n 一 2i)。 

现在 ， 硅 n 为 偶数 ， 则 令 i=n/2。 则 Sl(n/2) 就 表示 7T(n)=cn/2+7T(0) ， 也 就 是 a+cn/2。 
如 果 n 为 奇数 ， 就 令 i=(n-1)/2 。S((n-D)/2) 就 表示 7T(n)=c(n-D/2+7T(Q) ， 也 就 等 于 
b+c(n 一 1)/2 ， 因 为 有 7(D =2 。 

最 后 ， 必 须 将 特定 于 编译 器 和 机 器 的 常数 a、b 和 c 改 写 为 大 O0 表 示 。 多 项 式 atcn/2 和 
b+c(n 一 1)/2 都 具有 与 4 成 比例 的 高 阶 项 。 因 此 ， 该 问题 中 不 论 n 是 奇数 还 是 偶数 其 实 是 没关系 
的 ， 两 种 情况 下 split 的 运行 时 间 都 是 O(n) 。 这 又 是 个 很 直观 的 正确 解答 ， 因 为 对 长 度 为 的 
表 来 说 ，split 会 进行 约 n/2 次 递归 调用 ， 每 次 调用 的 时 间 都 是 0(1) 。 




















3.10.3” ”MergeSort 辆 数 


最 后 要 介绍 一 下 MergeSort 子 数 ， 我 们 在 图 3-28 中 再 次 展示 了 该 函数 。 对 参数 大 小 的 合适 
量度 n 还 是 待 排序 表 的 长 度 。 在 这 里 , 我 们 要 使 用 7(n) 表示 MergeSort 处 理 长 度 为 n 的 表 的 运行 
时 间 。 

我 们 选取 n=1 的 情况 作为 依据 情况 ， 而 n>1 (发 生 递归 调用 ) 的 情况 则 作为 归纳 情况 。 如 
果 对 MergeSort 加 以 人 研究， 就 会 发 现 ， 除 非 从 男 一 个 函数 中 调用 参数 为 空 表 的 MergeSort， 
不 然 是 没 办 法 在 参数 为 空 表 的 情况 下 进行 调用 的 。 原 因 在 于 ， 只 有 当 表 中 至 少 具有 两 个 元 素 时 
也 就 是 分 拆 后 得 到 的 两 个 表 中 都 至 少 有 一 个 元 素 时 , 才 会 执行 第 (4) 行 。 因此 可 以 忽略 n=0 的 情 
况 ， 并 直接 从 n=1 开始 进行 归纳 证 明 。 
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LIST MergeSort (LIST list) 
{ 
LIST SecondList; 


(1) if (list == NULL) return NULL; 
(2) else if (list->next == NULL) return list; 
else + 
/* 表 中 至 少 有 两 个 元 素 */ 
(3) SecondList = split(list); 
(4) return merge(MergeSort(list), MergeSort (SecondList)); 


} 








图 3-28 ”归并 排序 算法 


依据 。 如 果 1ist 由 一 个 元 素 构 成 ， 就 会 执行 第 (1) 行 和 第 (2) 行 ， 而 不 执行 其 他 代码 。 因 此 ， 
在 依据 情况 中 ，7() 是 0()。 

归纳 。 在 归纳 情况 中 ， 第 (1) 行 和 第 (2) 行 的 测试 都 是 失败 的 ， 因 此 可 以 执行 第 (3) 行 和 第 (4) 
行 的 程序 块 。 为 了 简化 问题 ， 可 以 假设 n 是 2 的 乘 方 。 作 出 这 种 假设 的 好 处 在 于 ， 当 n 为 偶数 时 ， 
刚好 会 将 表 分 割 成 长 度 为 n/2 的 两 等 分 。 此 外 ， 如 果 n 是 2 的 乘 方 ， 那 么 n/2 也 是 2 的 乘 方 ， 
次 递归 结束 二 分 出 来 的 都 是 等 分 的 表 , 直到 每 个 表 中 只 含 一 个 元 素 为 止 。 当 n>1 时 , MergeSort 
所 花 的 时 间 为 下 列 各 项 之 和 。 

(1) 两 次 测试 所 花 的 OO) 。 

(2) 第 (3) 行 的 赋值 和 对 split 的 调用 所 花 的 O00)+0(n) 。 

(3) 第 (4) 行 对 MergeSort 第 1 次 递归 调用 所 花 的 7T(n/2)。 

(4) 第 (4) 行 对 MergeSort 第 2 次 递归 调用 所 花 的 7T(n/2)。 

(5) 第 (4) 行 调用 merge 所 花 的 O(n) 。 

(6) 第 (4) 行 的 返回 语句 所 花 的 00) 。 




















跳 过 某 些 值 的 归纳 法 

读者 不 应 该 为 MergeSort 函 数 的 分 析 中 涉及 的 新 型 归纳 法 感到 担心 ， 尽 管 在 证 明 过 程 中 
我 们 跳 过 了 除 2 的 乘 方 之 外 的 所 有 数值 。 一 般 情况 下 ， 如 果 五 、P、… 是 一 列 与 我 们 想 证 明 的 命 
题 S 有 关 的 整数 ,就 可 以 证 明 S(ii) 作为 依据 ， 并 对 所 有 的 j 证 明 ，S(ii) 可 推出 SU) 。 这 就 是 一 
般 情况 下 我 们 所 认为 的 对 j 进 行 归纳 的 归纳 证 明 。 更 精确 地 说 ， 由 S'J) = S(i,) 定 义 命题 9'。 然 后 
通过 对 j 的 归纳 证 明 S'Y) 。 这样 的 话 , 就 可 以 是 =1、 计 =2、 训 =4，, 而 一 般 形式 就 是 i, =27。 

顺便 提 一 名 ,请 注意 ,，MergeSort 的 运行 时 间 7(n) 不 会 随 着 n 的 增加 而 减少 。 因 此 , 证 明 
了 对 等 于 2 的 乘 方 的 有 7T(z) 是 O(nlogn) ， 也 就 证 明了 对 所 有 的 n 都 有 7T(n) 是 O(nlogn) 。 





如 果 将 这 些 项 加 起 来 , 然后 依据 调用 sp1l1it 和 merge 的 O(n) 更 大 而 舍弃 OQ), 就 可 以 得 出 
在 归纳 情况 中 ，MergeSort 的 运行 时 间 边 界 是 27(n/2)+ O(n) 。 因 此 得 到 以 下 递 推 基 系 。 

依据 。7()= 0()。 

归纳 。7T(n)=27(n/2)+0O(n)， 其 中 nn 是 2 的 乘 方 而 且 大 于 1。 

下 一 步 是 要 用 含 具体 常数 的 函数 代 蔡 大 O 表 达 式 。 我 们 在 依据 中 用 常数 a 代 蔡 O() ,并 在 归 
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纳 步 又 中 用 bn 代 蔡 O(n) ， 因 此 递 推 关 系 就 变形 为 

依据 。7(D =a 。 

归纳 。7T(n)=27(n/2)+bn ， 其 中 n 是 2 的 乘 方 而 且 大 于 1。 

这 一 递 推 关系 要 比 我 们 之 前 了 解 的 更 难 ， 不 过 我 们 还 是 可 以 利用 相同 的 技巧 。 首 先 ， 可 以 
为 一 些 较 小 的 n 值 直接 写 出 O(n) 的 值 。 依 据说 明了 7()=a ， 而 归纳 步骤 则 告诉 我 们 





7T(Q2) = 270)+2b = 2a+2b 
T(4) = 27(2)+40 = 2(244+2b)+4b = 4a+8b 
T(8) = 27(4)+8b = 2(4a+8b)+8b = 8a+248 


T(16) = 27(8)+165 = 2(8a+24b)+16b = 16a+64b 
想 直 接 看 出 接 下 来 的 情况 可 不 容易 。 显 然 ，a 的 系数 与 n 的 值 是 同步 的 ， 也 就 是 说 7T(n) 是 zx 乘 
上 上 a， 再 加 上 某 个 数量 的 5。 不 过 5 的 系数 要 比 n 增 长 得 更 快 。5b 的 系数 与 n 之 间 的 关系 可 以 归纳 
为 如 下 : 





n 的 值 2 4 8 16 
b 的 系数 2 8 24 64 
比率 1 2 3 4 











比率 是 用 系数 5 除 以 xz 的 值得 到 的 。 因 此 ， 看 起 来 2 的 系数 是 x 乘 上 7 每 次 翻 倍 便 会 增长 1 的 另 一 个 
因子 。 具 体 来 讲 ， 我 们 可 以 看 出 这 个 比率 是 log,n ， 因 为 log,2=1，log,4=2 ，log,8=3， 且 
log,16=4。 因 此 推测 递 推 关系 的 解 为 7(n) = an+bnlog,n 是 合理 的 ， 至 少 对 表示 2 的 乘 方 的 n 
来 说 如 此 。 我 们 将 看 到 该 公式 是 正确 的 。 

要 为 该 递 推 关系 求解 ， 先 遵从 前 面 的 示例 中 使 用 过 的 策略 。 我 们 将 归纳 规则 写成 参数 m 的 
国 数 ， 形 如 
对 mm 为 2 的 乘 方 量 mw>1 ， T(m)=27T(m/2)+bm (3.5) 
接着 可 以 从 7T(n) 开始 ,利用 (3.3)， 用 具有 较 小 参数 的 表达 式 来 代替 7(n) ， 在 这 种 情况 下 ， 要 替 
换 的 表达 式 是 关于 7T(n/2) 的 。 也 就 是 ， 首 先 有 

T(n)=27(n/2)+bn (3.6) 
接 下 来 ,利用 (3.5)， 将 m 蔡 换 为 n/2 ， 从 而 得 到 蔡 换 (3.6) 中 7T(n/2) 的 表达 式 。 也 就 是 ，(3.5) 说 
明 有 7(/2)=27(m/4)+bn/2， 而 我 们 可 以 将 (3.6) 蔡 换 为 
T(n)=2(2T(n/4)+bn/2)+bn=47T(n/4)+2bn 
然后 ， 可 以 用 n/4 代 蔡 (3.5) 中 的 m， 从 而 将 7T(n/4) 替 换 为 27(n/18)+bn/4 ， 从 而 得 到 
T(n)=4(27(n/8)+bn/4)+2bn = 8T(n/8)+3bn 

我 们 要 通过 对 ;的 归纳 证 明 的 命题 就 是 

命题 SG) 。 如 果 1 三 nn 三 log,n ， 那么 T(n)=2'T(n/2')+ibn。 

依据 。 对 i=1, 命题 S(D) 就 是 说 7T(n) = 27T(n/2)+bn 。 这 个 等 式 是 对 归并 排序 运行 时 间 7T(n) 
的 定义 中 的 归纳 规则 ， 因 此 可 知 依据 是 成 立 的 。 

归纳 。 就 像 那 些 归 纳 假设 是 “如 果 …… 和 那么.……: ”形式 的 归纳 证 明 一 样 ， 如 果 ; 在 假设 范 
围 之 外 ,那么 归纳 步骤 必定 成 立 ， 这 里 ，i 宇 log, n 时 就 是 这 种 简单 的 情况 ， 这 时 SG+D 显然 
成 立 。 
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再 来 看 看 困难 的 情况 ,假设 i<logyn 。 还 要 假定 归纳 假设 SQ) 成 立 ,就 是 T(n)=27T(n/2')+ibn 。 
用 7/2 替换 (3.5) 中 的 m， 就 得 到 
T(n/2)=27T(n/2)+bn/2 (3.7) 
用 (3.7) 的 右边 蔡 换 SQi) 中 的 T(n/2)， 就 得 到 
TCD) =2 (27(n/2")+bn/2')+ibn 
=2"7T(n/2")+bntibn 
=2"7T(n/2")+(i+ Dbon 
最 终 的 等 式 就 是 命题 S(i+1) ， 这 样 就 证 明了 归纳 步骤 。 
于 是 可 以 得 出 SQ) ,也 就 是 7(n) = 27T(n/2)+ibn 对 在 1 和 logyn 之 间 的 任意 都 是 成 立 的 。 现 
在 要 考虑 公式 S(log,n) ， 也 就 是 
T(n)=2°®"T(n/2°®")+ (og, n)pbn 
我 们 知道 2 对" =n ( 请 回想 一 下 ，log,n 的 定义 就 是 ， 使 2 变 为 2， 要 对 2 乘 方 的 次 数 )。 还 有 
n/2%" =]1。 因 此 S(og,n) 可 以 写 为 
T(n)=nT(l)+bnlog,n 
由 7 的 定义 中 的 依据 ， 还 知道 7() =a 。 因 此 ， 
T(n)=ant+bnlog,n 
在 经 过 这 有 段 分 析 后 ， 必 须 将 常数 a 和 4b 蔡 换 为 大 O 表 达 式 ， 即 7T(n) 是 O(n)+O(nlogn)。" 因 
为 n 比 nlogn 增长 得 更 慢 ， 所 以 可 以 忽略 O(n) 这 项 ， 直 接 说 7T(n) 是 O(nlogn) 。 也 就 是 说 ， 归 并 
排序 算法 的 时 间 量 级 是 O(nlogn) 。 请 记 住 ,我们 已 经 证 明了 选择 排序 的 运行 时 间 是 O(n ) 。 虽 
然 严 格 地 讲 ， 这 里 的 O(n ) 只 是 个 上 界 ， 但 是 它 其 实 是 选择 排序 的 最 紧 简 单 边界 。 因 此 ， 可 以 
确定 ， 随 着 1 不 断 变 大 ,归并 排序 要 一 直 比 选择 排序 运行 得 更 快 。 从 实践 上 讲 ， 对 值 大 于 几 十 的 
1 来 说 ， 归 并 排序 要 比 选择 排序 更 快 。 


3.10.4 “习题 


(1) 绘 出 下 列 函数 的 结构 树 。 
(a) split 
(b) MergeSort 
(2)* 将 路 归并 排序 函数 定义 为 把 一 个 表 分 为 部 分 ， 在 为 每 部 分 排序 后 合并 各 部 分 得 到 结果 。 
(a) 用 kn 的 函数 表示 的 K 路 归并 的 运行 时 间 是 怎样 的 ? 
(b) ** 什 么 样 的 k 值 可 以 带 来 最 快 的 算法 ( 用 n 的 函数 表示 )? 这 个 问题 要 求 大 家 对 运行 时 间作 出 足 
够 精确 的 估算 ， 从 而 保证 自己 可 以 区 分 一 些 常数 因子 。 出 于 我 们 在 本 章 开 头 所 讨论 过 的 原因 ， 
在 实践 中 不 可 能 那样 精确 ， 所 以 大 家 需要 研究 一 下 由 习题 (a) 中 得 到 的 运行 时 间 是 怎样 随 着 1 变 
化 的 ， 并 据 此 得 出 近似 的 最 小 值 。 


3.11 ”为 岂 推 天 系 求解 


求解 递 推 关 系 的 技巧 有 很 多 。 本 闻 将 讨论 两 种 方法 。 第 一 ， 就 是 我 们 已 经 看 到 的 ， 反 复 将 




















QD 请 记 住 ， 在 大 0 表达 式 中 ， 我 们 不 必 为 对 数 指定 底数 ， 因 为 这 里 的 对 数 是 在 常数 因子 中 ， 所 以 所 有 底数 的 对 数 
都 是 一 样 的 。 
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递归 规则 代 换 到 它们 自身 中 ,直到 得 出 7T(n) 与 TO) 的 关系 , 或 者 7T(n) 与 依据 给 出 的 某 个 TO) 之 
间 的 关系 ( 如 果 1 不 是 依据 的 话 )。 第 二 种 方法 是 猜测 一 种 解 ， 并 将 其 蔡 换 到 依据 和 归纳 规则 中 
以 验证 其 正确 性 。 

在 3.9 和 3.10 两 节 中 , 我 们 已 经 为 Ttn) 准确 求解 了 。 不过， 因为 7(n) 实际 上 是 确切 运行 时 间 
的 大 O 上 界 ， 所 以 找 出 7T(n) 的 紧 上 界 就 够 了 。 因 此 ， 特 别 是 对 于 “猜测 并 验证 ”的 方法 ， 只 需 
要 求 出 的 解 是 递 推 关系 真正 解 的 上 界 就 可 以 了 。 

3.11.1 通过 反复 代 换 为 递 推 关 系 求 解 

示例 3.24 所 示 的 递 推 关 系 可 能 是 我 们 在 实践 中 直到 的 最 简单 的 递 推 关系 了 。 

依据 。7()=a。 

归纳 。 对 n>1 ，T(n)=7T(n-1+b。 

如 果 可 以 在 归纳 中 将 常数 bp 换 成 某 个 也 数 g(n) ， 就 可 以 将 这 种 形式 进一步 一 般 化 ， 于 是 我 
们 可 以 将 这 种 形式 写成 下 面 这 样 。 

依据 。7(D =a 。 

归纳 。 对 zi1，7COD) =7T(O2-D+g() 。 

只 要 递归 水 数 花 了 时 间 g(n) ,并 接着 用 比 当前 函数 调用 所 使 用 的 参数 小 1 的 参数 调用 自身， 
就 出 现 了 这 种 形式 。 例 子 有 示例 3.24 中 的 阶乘 洱 数 、3.10 节 中 的 merge 函 数 ， 以 及 2.7 节 中 的 递 
归 选 择 排序 。 在 前 两 个 孔 数 中 ，g(n) 是 和 常数， 而 在 第 三 个 函数 中 ，g(n) 是 n 的 线性 孔 数 。3.10 
节 中 的 split 函 数 也 基本 是 这 种 形式 ， 只 不 过 它 递归 地 调用 自身 所 使 用 的 参数 是 依次 减 小 2 的 。 
我 们 应 该 明白 ， 这 种 差别 是 不 重要 的 。 

接 下 来 通过 反复 代 换 来 求解 该 递 推 关 系 。 正 如 示例 3.24 中 那样 ， 首 先 将 归纳 规则 用 参数 mm 
的 函数 表示 出 来 ， 即 























T(m)=T(m-D+g(m) 
接着 反复 蔡 换 原 归 纳 规则 右边 的 7。 这 样 做 ， 就 可 以 得 到 一 串 表 达 式 : 
T(n)=7(n-1)+g(n) 
=7(n—2)+e(n—1)+g(n) 
=7(n-3)+g(n-2)+g(n-1)+g(n) 


=7(n-i)+g(n-it+l)+g(n-it+2)+**…+g(n—1)+g(n) 
运用 示例 3.24 中 介绍 的 技巧 ， 就 可 以 通过 对 ;的 归纳 ， 证 明 对 ;=1 2、…、7-1， 有 
TOD=Tw-D+Z SO- 放 

我 们 希望 选择 一 个 i 值 , 让 依据 情况 可 以 涵盖 7T(z -六 , 因此 我 们 选择 ;=7 -1。 因 为 TCD =a ， 
所 以 有 T(n)= ay gw=- 门 。 换 名 话说 ，7(z) 就 是 常数 a 加 上 从 2 到 n 的 所 有 g 之 和 ， 或 者 说 是 
4a+g(2)+g(G)+…+g(2) 。 除 非 所 有 的 g( 刀 都 为 0， 否 则 在 将 该 表达 式 转 换 为 大 0 表达 式 时 ，a 
这 项 都 是 无 关 轻 重 的 ， 因 此 一 般 只 需要 g(j) 的 和 就 行 了 。 
+ 示例 3.25 


考虑 一 下 图 2-22 所 示 的 递归 选择 排序 函数 ,我们 在 图 3-29 中 重新 展示 了 该 函数 的 函数 体 。 
在 需要 为 含 m 个 元 素 的 数组 排序 时 ， 也 就 是 当 参 数 的 值 为 n- m 时 ， 如 果 设 SelectionSort 也 
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数 的 运行 时 间 为 T(m) , 那么 就 可 以 得 出 关于 TO) 的 如 下 递 推 关系 。 首 先 , 依据 是 m=1。 这 时 ， 
只 有 第 (1) 行 执行 ， 花 的 时 间 为 0() 。 





if (i < n-1) { 

small = i; 

for (j = i+l;i j < n; j++) 
if (A[j] < A[smal1]) 

small = j; 

temp = A[smal1] ; 

A[small] = A[il]; 

A[i] = temp; 

recSSs(A, i+1, n); 


-一 一 一 一 一 一 一 一 -一 、 
‘O00 
i i te i a 








图 3-29 ”递归 的 选择 排序 


对 m>1 时 的 归纳 ， 我们 会 执行 第 (1) 行 的 测试 以 及 第 (2)、(6)、(7)、(8) 行 的 赋值 ， 这 些 语句 
的 运行 时 间 是 0(Q) 。 而 第 (3) 至 第 (5) 行 的 for 循 环 的 运行 时 间 为 O(n 一 i) ， 或 者 O(m) ， 就 像 我 们 
在 示例 3.17 中 讨论 过 的 迭代 选择 排序 程序 那样 。 要 知道 原因 ， 请 注意 第 (4) 行 和 第 (5) 行 的 循环 体 
所 花 的 时 间 为 0(1)， 而 我 们 要 进行 m1 次 循环 。 所 以 ,该 for 循 环 的 运行 时 间 主 导 了 第 (1) 至 第 
(8) 行 的 运行 时 间 ， 这 样 就 可 以 将 整个 函数 的 运行 时 间 7(m) 写 为 T(m 一 1)+O(m)。 第 2 项 O(m) 覆 
盖 了 第 (1) 至 第 (8) 行 ， 而 7T(m 一 1) 这 项 则 是 第 (9) 行 的 递归 调用 的 时 间 。 如 果 将 隐藏 在 大 O 表 达 式 
背后 的 常数 因子 蔡 换 为 某 个 具体 的 常数 ， 就 可 以 得 到 以 下 递 推 关 系 。 

依据 。7T()=a。 

归纳 。 对 m>1，T(m)=T(m-1)+bm 。 

该 递 推 关系 具有 我 们 研究 过 的 形式 ， 其 中 g(m) =b(m) 。 也 就 是 说 ， 该 递 推 关系 的 解 为 


T(m) = a Bl 











a+2b+3b+**…+mb 
at+b(m—l1)(m+2)/2 
因此 7T(m) 是 Ol(m”)。 我 们 感 兴 趣 的 是 selectionSort 函 数 处 理 长 度 为 n 的 整个 数组 时 的 运行 
时 间 ， 也 就 是 说 ， 当 用 i=1 调 用 函数 时 ， 我 们 需要 7(n) 的 表达 式 ， 并 得 出 它 是 O(n”) 。 因 此 ， 
递归 的 选择 排序 是 二 次 的 ， 就 像 迭 代 的 选择 排序 那样 。 

递 推 的 男 一 种 常见 形式 是 在 3.10 节 中 为 MergeSort 隐 数 得 出 的 递 推 关 系 。 

依据 。7T()=a。 

归纳 。7T(n) =27(n/2)+g(n)， 其 中 n 是 2 的 乘 方 而 且 大 于 1。 

该 递 推 关系 表示 的 是 一 个 递归 算法 , 它 通过 将 大 小 为 n 的 问题 细 分 为 两 个 大 小 为 n/2 的 子 问 题 
来 解决 问题 。 这 里 g(n) 是 创建 子 问题 以 及 结合 解决 方案 所 花 的 时 间 。 例 如 ，MergeSort 将 大 小 
为 n 的 问题 分 为 大 小 为 n/2 的 两 个 部 分 。 函 数 g(n) 具有 bn 的 形式 ， 其 中 5b 是 某 个 和 常数， 因为 
MergeSort 除 了 递归 调用 自身 之 外 , 所 花 的 时 间 是 O(n) , 主要 就 是 用 在 split 和 merge 算 法 上 。 

要 求解 该 递 推 关系 ,需要 替换 等 式 右边 的 T7。 这 里 我 们 假设 对 某 个 kK 有 n= 2。 递 推 关 系 可 以 
写 为 参数 为 m 的 函数 : T(m) =2t(m/2)+g(m)。 如 果 用 n/2 蔡 换 m， 就 得 到 

T(n/2')=27T(n/2")+g(n/2) (3.8) 
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如 果 由 归纳 规则 开始 ， 接 着 用 ; 值 逐 渐变 大 的 G3.8) 替 换 7， 就 会 发 现 

T(n) = 27(n/2)+g(n) 
2(27(n/2°)+g(n/2))+g(n) 
= 27(n/22)+2g(n/2)+g(n) 
= 2° (27(n/2°)+g(n/2’))+2g8(n/2)+g(n) 
= 27(n/2°)+2’g(n/2°)+2g(n/2)+ g(n) 








= 2'T(n/2)+5 2 g(n12)) 
如 果 n = 2， 我 们 知道 T(n/2*)=7TQ)=a。 因 此 ， 当 i=k 时 ， 也 就 是 当 i=1log,n 时 ,可 以 得 到 
递 推 关 系 的 解 为 
(log2 7)-1 


T(n)=ant+ >》 2’g(n/2’) (3.9) 


/=0 


直观 地 讲 , (3.9) 的 第 一 项 表示 依据 值 aw 读 来 的 时 间 , 也 就 是 以 大 小 为 1 的 参数 调用 该 递归 也 数 
1 次 的 时 间 。 而 和 项 则 是 递归 所 花 的 时 间 ， 它 表示 以 大 小 大 于 1 的 参数 执行 的 所 有 调用 的 总 时 间 。 

图 3-30 展 示 了 MergeSort 困 数 执行 期 间 的 时 间 积 累 情 况 。 它 表示 为 8 个 元 素 排 序 的 时 间 。 
第 一 行 表 示 最 外 层 的 调用 ， 涉 及 全 部 8 个 元 素 ; 第 二 行 表示 对 两 组 4 个 元 素 的 两 次 调用 ; 第 三 行 
表示 对 4 组 两 个 元 素 的 4 次 调用 。 最后， 底部 那 行 表示 对 长 度 为 1 的 表 调 用 MergeSort 共 8 次 。 一 
般 来 说 ， 如 果 原 始 无 序 表 中 有 7 个 元 素 ， 那 么 通过 引发 其 他 调用 的 MergeSort 调 用 完成 加 的 工 
作 就 需要 log,n 层 调 用 ， 因 此 这 些 调用 累计 的 时 间 就 是 bnlog,n 。 还 将 有 一 层 的 调用 不 会 引起 
进一步 的 调用 ， 这 些 调用 所 花 的 总 时 间 是 an。 请 注意 ， 前 log, n 层 调 用 表示 的 是 (3.9) 中 的 和 项 ， 
而 最 下 面 的 那 层 表示 az 那 项 。 






































图 3-30 ”对 MergeSort 的 调用 所 花 的 时 间 


+ 示例 3.26 
在 MergeSort 的 情况 中 ， 子 数 g(n) 是 pn， 其 中 b 是 某 个 常数 。 因 此 含 这 些 参数 的 (3.9) 的 解 
就 是 
(log, n)-1 | | 
T(n)= ant+ pa 2’bn/2’ 
j=0 
(log> n)-1 
= ant+pbn > 1 


j=0 
= an+bnlogn 
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最 后 得 出 的 等 式 是 因为 和 项 中 有 1og,n 个 项 ， 而 这 些 项 都 是 1。 因 此 ， 当 g(n) 是 线性 函数 时 ， 式 
(3.9) 的 解 就 是 O(nlogn) 。 
3.11.2 ”通过 猜测 解 为 递 推 关 系 求解 

求解 递 推 关系 的 另 一 种 实用 方法 就 是 猜测 一 个 解 f(n) ， 接 着 使 用 递 推 关系 证 明 
T(n) 三 f(n)。 这 可 能 不 会 给 出 Ttn) 的 精确 值 ， 不 过 如 果 它 给 出 了 紧 上 界 ， 也 是 能 邻 人 满意 的 。 
通常 我 们 只 会 猜测 f(n) 这样 的 函数 形式 ， 不 去 指定 一 些 参数 。 人 例如， 我们 可 以 猜测 对 某 c 和 2， 
f(n)=an”。 这 些 参数 的 值 都 是 确定 的 ， 因 为 我 们 要 为 所 有 nn 证明 T(n) 二 f(n)。 

虽然 可 能 党 得 能 准确 猜测 解 是 件 离 奇 的 事 ， 但 我 们 经 常 能 通过 观察 一 些 较 小 z 值 所 对 应 的 
7(n) 来 推断 出 高 阶 项 。 然 后 就 可 以 舍弃 某 些 低 阶 项 ， 并 看 看 它们 的 系数 是 否 非 0。” 


+ 示例 3.27 

我 们 再 来 研究 一 下 3.10 节 中 介绍 过 的 MergeSort 北 推 关 系 ， 将 其 写 为 

依据 。7T()=a。 

归纳 。7T(n)=27(n/2)+g(n)， 其 中 n 是 2 的 乘 方 而 且 大 于 1。 

我 们 要 猜测 7T(n) 的 上 界 是 f(n) = cnlog, n+d ,其 中 c 和 4d 是 某 些 和 常数。 回想 一 下 ， 这 种 形式 
并 不 完全 正确 ， 在 之 前 的 示例 中 ， 我 们 得 出 的 解 都 具有 O(nlogn) 项 以 及 O(n) 项， 而 不 市 常数 
项 。 不 过 ， 这 个 猜测 对 证 明 O(nlogn) 是 7T(n) 的 上 界 来 说 已 经 足够 好 了 。 

接着 要 对 nn 进行 完 全 归纳 ， 证 明 以 下 命题 ， 其 中 c 和 4 是 某 些 常数 。 

命题 S(n) 。 如 果 n 是 2 的 乘 方 而 且 n 三 1， 那么 7T(n) 入 f(n) ， 其 中 f(n) 是 也 数 cnlog,n+d 。 

依据 。 当 2 =1 时 ，7G) 科 f() 表示 a 三 4 ,因为 当 n=1 时 ，f(n) 中 cnlog,n 这 项 的 值 为 0， 
则 fQ)=4 ， 而 且 之 前 已 经 给 定 了 7()=a。 

归纳 。 对 所 有 的 i<n, 假设 SQ) 为 真 ， 并 证 明 对 某 些 n>1 ，S(n) 为 真 。 如 果 n 不 是 2 的 乘 方 ， 
就 没什么 好 证 明 的 ， 因 为 这 时 具有 “如 果 …… 那 么 ……” 形 式 的 命题 S(n) 的 如 果 部 分 不 为 真 。 
因此 ， 考 虑 困难 的 情况 ， 也 就 是 x 是 2 的 乘 方 的 情况 。 可 以 假设 S(n/2) 为 真 ， 也 就 是 假设 

T(n/2) (cn/2)log,(n/2)+d 
为 它 是 归纳 假设 的 一 部 分 。 对 归纳 步骤 来 说 ， 需 要 证 明 
T(n) f(n)=cnlog,nt+d 
当 n 宇 2 时 ，7T(n) 定义 的 归纳 部 分 告诉 我 们 
T(n) 27(n/2)+bn 
将 归纳 假设 应 用 到 7T(n/2) 的 边界 ， 就 有 
T(n) 2[c(n/2)log,(n/2)+dl+bn 
因为 log,(n/2)=1log,n 一 log, 2=1log,n 一 1， 所 以 可 以 将 这 一 表达 式 简 化 为 
T(n) cnlog,n+(b—-c)nt+2d (3.10) 

现在 要 证 明 7(n) 三 cnlog, n+qd , 条件 是 (3.10) 右 边 的 式 子 中 ，cnlog, n+d 之 外 的 部 分 最 多 为 0， 
也 就 是 说 (5-c)jntq 三 0。 因 为 n>1 ， 所 以 当 dg 关 0 且 0-c 科 -4d 时 该 不 等 式 成 立 。 

要 让 f(n)=cnlog,n+d 成 为 T(n) 的 上 界 ， 需 要 满足 以 下 3 条 约束 。 























J 要 知道 ， 与 递 推 关系 理论 很 类 似 的 微分 方程 理论 也 依赖 于 一 些 常见 形式 的 方程 的 已 知 解 ， 并 据 此 通过 合理 的 猜 
测 求解 其 他 方程 。 
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(1) 约束 a 三 a 来 自 依 据 部 分 。 

(2) d>0 来 自 归纳 部 分 ， 不 过 因为 已 知 e>0 ， 所 以 由 (1) 便 可 得 到 该 不 等 式 。 

(3) bp-c 三 -4 ,或 者 说 c 宇 bpt+qd ， 也 是 来 自 归纳 部 分 。 
如 果 令 d =4a 而 且 c=a+b，, 那么 这 些 约束 显然 可 得 到 满足 。 我 们 现在 就 通过 对 n 的 归纳 证 明了 ， 
对 所 有 大 于 等 于 1 目 为 2 的 乘 方 的 "， 有 

T(n)(atb)nlog,nta 

该 参数 表明 了 7T(n) 是 O(nlogn) ， 也 就 是 说 Tln) 的 增长 速度 不 会 比 nlogn 快 。 不 过 ， 我 们 
得 到 的 边界 (a+b)nlog,n+a 要 比 示例 3.26 中 得 到 的 确切 解答 bnlog,n+an 稍 大 一 些 , 但 至 少 是 
成 功 得 到 了 边界 。 假 使 我 们 选择 了 更 简单 的 猿 测 f(n) = cnlog,n ， 可 能 就 失败 了 ， 因 为 不 存在 
可 以 使 f0) 三 a 的 c 值 。 原因 在 于 ，cxlxlog,1=0， 这 样 就 有 Ad) = 0 。 如 果 z>0 ， 就 显然 不 能 
使 f(D) 三 a。 




















不 等 式 的 处 理 
示例 3.27 中 的 不 等 式 7T(n) 三 cnlogJnt+d ， 是 从 另 一 个 不 等 式 T(n) 三 cnlog,nt+ 
(bp 一 c)n+24 得 出 的 。 方 法 是 找 出 “多 余 的 量 ”"， 并 要 求 它 至 多 为 0。 一般 的 原则 是 ,假设 有 不 
等 式 4 三 B+E ， 那 么 如 果 要 证 明 4 三 ,只 需要 证 明王 0 就 够 了 。 在 示例 .27 中 ,A 是 Tl(n)， 
B 是 cnlog,n+d ， 而 那个 “多 余 的 量 ” 是 (bp-c)jntd。 





+ 示例 3.28 

现在 考虑 的 是 在 本 书后 续 内 容 中 将 要 遇 到 的 一 个 递 推 关系 。 

依据 。G(1)=3。 

归纳 。 对 nl1，G(n)= 2” +1D)G(n/2)。 

该 递 推 关系 包含 的 是 实际 的 数字 ,而 不 是 像 a 这 样 的 符号 常数 。 在 第 13 章 中 ,我们 将 使 用 这 
样 的 递 推 关 系 计算 电路 中 门 的 数量 ,而且 门 的 数量 是 可 以 准确 计 出 的 ， 不 需要 用 大 0 表示 法 去 
隐藏 不 可 知 的 常数 因子 。 

如 有 果 我 们 考虑 一 下 通过 反复 代 换 得 到 的 解 , 就 可 能 发 现 ,要 将 G(n) 用 含 CO) 的 项 表示 出 来 ， 
需要 进行 log,(n 一 1) 次 代 换 。 随 着 代 换 的 不 断 进行 ， 就 会 得 到 因子 

(2 + D2 +D(2" +D…(22+D 
如 果 舍 去 每 个 因子 中 的 “+1” 项 ， 就 会 近似 地 得 出 积 2"2”2”“…2 ， 也 就 是 
DatR/At tl 
或 者 如 果 为 指数 部 分 的 几何 级 数 求 和 , 就 是 2 , 也 就 是 2 的 一 半 , 因此 可 以 猜测 , 2” 是 解 G(n) 
中 的 项 。 不 过 ， 如 果 猜 测 f(n) = c2” 是 Go) 的 上 界 ， 就 可 能 会 求解 失败 ， 读 者 可 以 自行 验证 。 
也 就 是 说 ， 我 们 得 到 了 两 个 涉及 c 的 不 等 式 ， 但 它们 不 是 解 。 

此 我 们 会 猜测 下 一 种 最 简单 的 形式 ，f(n) = c2” +d ,而 这 样 就 能 成 功 求解 了 。 也 就 是 说 ， 
可 以 通过 对 n 的 完全 归纳 证 明 以 下 命题 ， 其 中 c 和 a 是 某 些 常数 。 

命题 S(n) 。 如 果 n 是 2 的 乘 方 且 n 宇 1， 那么 G(n) 三 c2”"+d。 

依据 。 如 果 n=1 ， 那 么 必须 证 明 G() 三 c2 +d ， 也 就 是 3 三 2c+4d 。 该 不 等 式 变 成 了 对 c 
和 4 的 约束 。 








3.11 为 递 推 关 系 求解 121 





归纳 。 像 示例 3.27 那 样 ， 唯 一 的 难点 出 现在 当 n 为 2 的 乘 方 而 且 要 从 Sln12) 证 明 S(n) 时 。 这 
种 情况 下 等 式 就 成 了 
G(n/2)c2"? +d 
必须 证 明 S(n) ， 也 就 是 G(n) 三 c2”"+4a 。 首 先 从 G 的 归纳 定义 开始 。 
G(n)= (2"2 +D)G(n/2) 
然后 用 得 到 的 上 界 蔡 换 Gn/ 2) ， 就 将 上 述 表达 式 转换 成 了 
G(n) (20R +Dc2 2 +4) 
加 以 简化 ， 就 得 到 
Gn ec2 +(c+d)2™ ?+d 
这 要 给 出 所 需 的 G(o) 的 上 界 c2"+qd ， 因 此 就 要 有 右 侧 多 余 的 部 分 (c+q)2” 不 大 于 0， 而 
这 只 需 有 c+4d 三 0 就 足够 了 。 
我 们 需要 选择 c 和 a 来 满足 两 个 不 等 式 。 
(1) 源 于 依据 部 分 的 2c+d 三 3。 
(2) 源 于 归纳 部 分 的 ctd 三 0。 
例如 ， 如 果 c=3 且 4 = -3 ， 则 两 个 不 等 式 都 能 满足 。 那 么 我 们 就 知道 G(n) 三 3(2” -1)。 因 此 ， 
G(n) 是 随 着 zx 指数 增长 的 。 刚 好 这 个 函数 就 是 确切 的 解 ， 也 就 是 说 G(n) =3(2” -1) ,读者 可 以 
自己 通过 对 n 的 归纳 来 证 明 这 一 点 。 





对 解 的 总 结 


下 面 的 表格 中 列 出 了 一 些 最 常见 的 递 推 关 系 ， 其 中 包括 本 节 未 曾 介 绍 的 。 在 每 种 情况 中 ， 
假设 依据 等 式 为 7(1)=a ,而且 有 Kk 之 0。 


归纳 等 式 T(n) 
TOD =T(n—1)+bn’ O(n®) 
T(n)=cT(n-])+bn* 其 中 ce>1 O(c”) 
T(n)=cT(n/qd)+bn* 其 中 c>q* O(n®s°) 
T(n)=c7T(n/qd)+bn* 其 中 c=<a*“ O(n’) 
T(n)=cT(n/d)+bn* 其 中 c=q* O(n' logn) 


若 上 述 等 式 中 的 bn' 被 蔡 换 为 任意 的 Kk 次 多 项 式 ， 其 结论 也 都 是 成 立 的 。 





3.11.3 “习题 


(1) 设 7(n) 是 由 如 下 递 推 关系 定义 的 
对 n>1 ，T(n)=T(n-1)+g(n) 
通过 对 i 的 归纳 证 明 ， 如 果 1 三 i 三 n ， 那 么 


T(W)=7T(1-)+ > s(n-) 


C) 假设 有 如 下 形式 的 递 推 关系 
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7T()=a 
对 n>1 ,7T(n)=7T(n-1)+g(n) 
如 果 g(n) 分 别 是 
(a) rm 
(b) n* +3n 
(c) 7113/2 
(d) nlogn 
(e) 2 
给 出 解 的 紧 大 O 上 界 。 
(3) 假设 有 如 下 形式 的 递 推 关系 
T()=a 
当 n 是 2 的 乘 方 且 n>1 时，7T(n)=T(n/2)+g(n) 
如 果 g(n) 分 别 是 
(a) rn 
(b) 2n 
(c) 10 
(d) nlogn 
(e) 2" 
给 出 解 的 紧 大 O 上 界 。 
(4) * 将 下 列 各 项 作为 如 下 递 推 关 系 的 解 进行 猜测 。 
7(D =a 
当 n 是 2 的 乘 方 是 n>1 时，7T(n)=27T(n/2)+bn 
(a) cnlogyn+dnte 
(b) cnt+d 
(c) en’ 
这 暗示 了 未 知 常 数 c<、qd 和 e 所 具有 的 哪些 约束 ? 对 哪些 形式 而 言 ， 存 在 7T(n) 的 上 界 ? 
(5) 证 明 : 如 果 我 们 为 示例 3.28 中 的 弟 推 关系 猜测 G(n) 三 c2”， 那 么 将 没 法 找到 解 。 
(6)* 证 明 : 如 果 
T(l)=a 
对 n>1 ，T(n)=T(n-1)+n” 
那么 T(n) 是 O(n) 。 大 家 可 以 假设 三 0。 证 明 这 是 7T(n) 的 最 紧 简单 大 O 上 界 ， 也 就 是 说 ， 如 果 
mk+1 ，T(n) 就 不 是 O(n”") 了 。 提 示 : 用 T(n-i) (其 中 i=1、2、… ) 展开 7T(n) ， 从 而 得 到 上 
界 。 要 得 到 下 界 ， 就 要 证 明 对 某 个 特定 的 c>0 而 言 ，7T(n) 至 少 是 cn 。 
(7) ** 证 明 : 如 果 
7T(l))=a 
对 n>1 ，T(n)=cT(n -1)+P(n) 
其 中 p(n) 是 n 的 任意 多 项 式 且 c>1 ， 那么 7T(n) 是 O(c") 。 还 有 ， 证明 这 是 最 紧 简 单 大 O 上 界 ， 也 
就 是 说 ， 如 果 d<c ， 那 么 T(n) 不 是 O(4d”)。 
(8) ** 考虑 递 推 关系 
7(D=a 
当 n 是 4 的 乘 方 时 ，T(n)=cT(n/q)+bn” 
用 TV1q’) (其 中 i=1、2、… ) 六 代 地 展开 7T(n) ， 证 明 
(a) 如 果 c>qa*， 那 么 7T(n) 是 O(n “) 
(b) 如 果 c=qa*， 那 么 T(n) 是 O(n*logn) 
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(c) 如 果 c=<a* ， 那 么 T(n) 是 O(n“) 

(9) 求解 以 下 递 推 关 系 ， 其 中 每 个 关系 都 有 7T(1)= a 。 
(a) 当 n 是 2 的 乘 方 且 n>1 时，7T(n)=37T(n/2)+m 
(b) 当 n 是 3 的 乘 方 且 n>1 时，T(n)=107T(n/3)+n? 
(c) 当 n 是 4 的 乘 方 有 是 n>1 时 ，T(n)=167T(n/4)+n? 
可 能 会 用 到 习题 (8) 中 的 解答 。 

(10) 求解 递 推 关系 
T(l)=a 
当 n 是 2 的 乘 方 且 n>1 时，7T(n)=3”T(n/2) 

(11) 斐 波 那 契 递 推 关系 是 FF(O)=FD=1， 且 
对 n>1, F(n)=F(n-l)+F(n-2) 
来 自 该 数列 的 值 F(0) 、FG) 、FC2) … 就 是 斐 波 那 契 数 ， 其 中 从 第 3 个 数 起 ， 每 个 数 都 是 相 邻 前 两 
个 数 的 和 ， 见 3.9 节 习题 (4)。 设 r=(+V5)/2 ， 该 常数 r 称 为 黄金 比例 ， 而 且 其 值 约 为 1.62。 证 明 : 
F(n) 是 O(r") 。 提 示 : 对 于 归纳 部 分 ， 可 以 猜测 对 某 个 z 有 Fo) 三 ar”， 并 尝试 通过 对 n 的 归纳 证 
明 该 不 等 式 。 依 据 必须 是 由 n=0 和 n=1 这 两 个 值 组 成 ,在 归纳 步骤 中 ,可 以 注意 到 满足 r=r+l 
这 一 关系 。 


3.12 ”小结 


以 下 是 本 章 涵 盖 的 一 些 重点 概念 。 

口 许多 因素 会 对 程序 算法 的 选择 产生 影响 ， 不 过 通常 人 简单、 易于 实现 和 高 效 起 主导 作用 。 

口 大 0 表达 式 提 供 了 一 种 很 方便 的 程序 运行 时 间 上 界 表示 法 。 

口 在 评估 C 语 言 复合 语句 〈 比 如 for 循 环 和 条 件 语句 ) 的 运行 时 间 时 ， 存 在 一 些 递归 规则 ， 
这 些 规则 是 用 这 些 复合 语句 各 组 成 部 分 的 运行 时 间 表 示 的 。 

口 通过 绘制 表示 语句 航 套 结构 的 结构 树 ， 并 按照 从 下 至 上 的 顺序 评估 结构 树 中 各 部 分 的 运 
行 时 间 ， 可 以 评估 函数 的 运行 时 间 。 

口 递 推 关系 是 为 递归 程序 运行 时 间 建 模 的 一 种 自然 方法 。 

口 要 为 递 推 关 系 求解 ， 既 可 以 通过 反复 代 换 ， 也 可 以 通过 先 猜测 解 并 验证 猜测 为 正确 的 

分 治 法 是 一 种 重要 的 算法 设计 技巧 。 使 用 分 治 法 时 会 将 问题 分 为 藻 干 个 子 问题 ， 这 些 子 问 

题 的 解答 将 会 组 合成 整个 问题 的 解答 。 可 根据 一 些 经 验 法 则 来 评估 由 此 产生 的 算法 〈 运 行 时 间 
为 0Q), 且 对 大 小 为 n-1 的 子 问 题 调用 上 自 映 所 花 时 间 为 O(n) ) 的 运行 时 间 。 这 种 算法 的 例子 包 
括 阶 乘 函 数 和 merge 靖 数 。 

口 更 为 一 般 的 情况 是 ， 函 数 花 的 时 间 为 O02) ， 而 且 对 大 小 为 n-1 的 子 问 题 调用 自身 花 的 
时 间 是 O(n" )。 

口 如 果 函 数 调用 自身 两 次 ， 而 递归 行进 了 log,n 层 ( 就 像 归并 排序 那样 )， 那么 总 运行 时 间 
就 是 O(nlogn) 乘 上 每 次 调用 的 开销 ， 再 加 上 O(n) 乘 上 依据 部 分 的 开销 。 在 归并 排序 中 ， 
包括 依据 调用 在 内 ， 每 次 调用 的 开销 都 是 0(1)， 所 以 总 运行 时 间 就 是 O(nlogn)+0(n)， 
或 者 是 O(nlogn) 。 

口 如 果 郴 数 调用 自身 两 次 ， 而 递归 行进 了 zxz 层 ， 就 像 3.9 节 习题 (4) 的 斐 波 那 契 程序 那样 ， 那 
么 运行 时 间 就 是 指数 为 "的 指数 形式 。 
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在 计算 机 科学 中 ， 我 们 常 需要 为 事物 计数 ， 并 度量 事件 的 可 能 性 。 计 数 属于 数学 中 的 组 合 
学 分 文 ， 而 度量 事件 的 可 能 性 则 属于 概率 论 的 范畴 。 本 章 要 介绍 这 两 个 领域 的 基本 原理 。 我 们 
会 了 解 到 一 些 问题 的 答案 ， 诸 如 程序 中 有 多 少 条 执行 通路 ( execution path )， 或 给 定 通路 出 现 的 
可 能 性 有 多 大 等 。 


4.1 ”本章 主要 内 容 


本 章 给 出 了 一 系列 越 来 越 复 杂 的 情况 ， 每 种 情况 都 通过 一 个 简单 的 范例 问题 说 明 ， 借 此 对 
组 合 (或 “计数 ”) 加 以 研究 ， 而 且 会 为 每 个 问题 推导 出 用 于 确定 可 能 结果 数量 的 公式 。 要 研究 
的 问题 包括 以 下 几 个。 

D 为 分 配 计数 (4.2 )。 范 例 问题 是 : 用 k 种 颜色 为 n 所 房屋 粉刷 共有 多 少 种 不 同方 式 。 

口 为 排列 计数 (4.3 方 )。 范 例 问题 是 : 确定 n 个 不 同 项 能 构成 多 少 种 不 同 的 次 序 。 

口 为 有 序 选 择 计数 〈4.4 节 )， 也 就 是 从 mx 个 不 同事 物 中 选 出 k 修 ， 并 按 次 序 排列 这 个 事物 。 

范例 问题 是 : 计算 赛马 比赛 中 不 同 马 匹 获 得 前 三 名 的 排列 方法 数 。 

D 为 n 个 事物 中 的 m 个 的 组 合计 数 (4.5 市 )， 也 就 是 从 n 个 不 同 对 象 中 选择 m 个 ， 而 不 考虑 被 

选取 对 象 的 次 序 。 范 例 问 题 是 : 为 可 能 的 扑 殉 牌 型 计数 。 

口 为 具有 有 茶 些 重复 项 的 排列 计数 〈4.6 节 ) 范例 问题 是 : 计算 某 些 字 母 多 次 出 现 的 单词 的 

变 位 词 的 数量 。 
口 为 分 发 容 带 中 对 象 ( 可 能 具有 重复 对 象 ) 的 方法 计数 ( 4.7 市 )。 范 例 问 题 是 : 为 给 小 朋 
友 分 发 水 果 的 方法 计数 。 

本 章 的 后 半 部 分 要 讨论 的 是 概率 论 ， 涵 盖 以 下 主题 。 

D 基本 概念 : 概率 空间 、 实 验 、 事 件 、 事 件 概 率 。 

口 条 件 概 率 与 事件 独立 性 。 这 些 概念 可 帮助 我 们 了 解 ， 对 一 次 实验 结果 (〈 比如 纸牌 的 牌 面 

图 案 ) 的 观察 会 怎样 影响 未 来 事件 的 概率 。 
D 概率 推理 和 方法 。 通 过 这 些 推 理 和 方法 ， 可 从 与 事件 的 概率 及 条 件 概率 相关 的 有 限 数据 
中 ， 估 算出 事件 组 合 的 概率 。 

我 们 还 将 讨论 概率 论 在 计算 机 领域 的 一 些 应 用 ， 包 括 根据 数据 进行 或 然 性 推理 的 系统 ， 以 

及 一 类 “有 很 大 概率 ”有 效 但 不 保证 一 直 有 效 的 算法 。 
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4.2 为 分 配 计数 


一 种 简单 却 极 重要 的 计数 问题 是 处 理 一 组 项 ， 为 每 一 项 指定 某 一 组 固定 值 中 的 茶 个 值 。 我 
们 需要 确定 可 能 有 多 少 种 将 值 分 配给 项 的 方式 。 


+ 示例 4.1 
图 4-1 展 示 了 一 个 上 典型 的 例子 ， 其 中 有 并 排 4 所 房屋 ， 而 且 可 将 每 所 房屋 粉刷 成 红 、 绿 、 蓝 
三 种 颜色 中 的 一 种 。 在 本 例 中 ， 房 屋 就 是 之 前 所 提 到 的 “项 ”， 而 颜色 就 是 “ 值 "。 图 4-1 展 示 
人 一 种 可 能 的 颜色 分 配方 式 ， 其 中 第 一 所 房屋 被 刷 成 红色 ， 第 一 所 和 第 和 四 所 被 刷 成 蓝 色 ， 而 第 
三 所 被 刷 成 绿色 。 


全 让- 


图 4-1 房屋 颜色 分 配 的 一 种 方式 


要 回答 “有 多 少 种 不 同 分 配方 式 ”， 首先 需 要 定义 我 们 所 说 的 “分 配 ” 具 有 何 种 含义 。 在 本 
一 种 分 配方 式 就 是 一 个 具有 4 个 值 的 表 ， 其 中 每 个 值 都 是 从 红 、 绿 、 蓝 这 3 种 颜色 中 任 选 
。 接 下 来 要 分 别 用 字母 RR、G 和 8 来 表示 这 3 种 颜色 。 而 当 且 仅 当 两 个 这 样 的 表 至 少 有 一 个 位 
本 同时 ， 我 们 称 这 两 个 表 是 不 同 的 。 
在 这 个 房屋 与 颜色 的 例子 中 ， 可 以 为 第 一 所 房屋 任 选 三 种 颜色 之 一 。 不 管 为 第 一 所 房屋 选 
择 了 什么 颜色 , 在 粉刷 第 二 所 房屋 时 还 是 有 这 三 种 选择 。 因此 粉刷 前 两 所 房屋 的 方式 有 9 种 ， 对 
应 着 9 个 不 同 的 字母 对 ， 每 个 字母 都 是 R、G 和 B 这 三 者 之 一 。 类 似 地 ， 对 前 两 所 房屋 所 具有 的 9 
种 分 配方 式 的 每 一 种 而 言 ， 都 可 以 为 第 三 所 房屋 在 三 种 颜色 中 任 选 其 一 。 这 样 一 来 ， 前 三 所 房 
屋 的 粉刷 方式 就 达到 了 9x3 = 27 种 。 最 后 ， 这 27 种 分 配方 式 中 对 应 的 第 四 所 房屋 又 都 能 在 三 种 
颜色 中 任 选 其 一 ， 因 此 总 共有 27x3 = 81 种 粉刷 房屋 的 方式 。 


4.2.1 为 分 配 计 数 的 规则 


可 以 对 以 上 示例 加 以 扩展 。 在 一 般 情形 下 ， 有 一 列 n 个 “项 ”， 比 如 示例 4.1 中 的 房屋 ; 还 有 
一 组 k 个 “ 值 "， 如 示例 4.1 中 的 颜色 ， 可 以 给 某 个 项 指 0 一 种 。 一 种 分 配 就 是 一 个 
含有 n 个 值 的 表 wy) 。v ww 中 的 每 一 个 都 是 从 这 K 个 值 中 任 选 其 一 。 这 种 分 配 指定 
了 vw 从 v1 到 第 i 项 的 值 ， 其 中 i=1, 2, …, 7 

当 有 n 个 项 ， 而 且 可 以 为 每 一 项 指定 k 个 值 之 一 时 ， 就 会 有 Kr 种 不 同 的 分 配 。 例 如 ， 在 示例 
4.1 中 ， 一 共有 7 = 4 项 ， 也 就 是 有 4 所 房屋 ， 而 且 有 大 = 3 个 值 ， 也 就 是 有 3 种 颜色 。 我 们 就 可 以 
计算 出 总 共有 81 种 不 同 的 分 配 。 请 注意 ， 就 是 3* =81 种 。 可 以 通过 对 xm 的 归纳 证 明 这 一 一 般 
规则 。 

命题 S(n) 。 为 n 个 项 中 每 一 项 分 配 k 个 值 中 的 任 一 个 ， 共 及 种 方式 。 

依据 。 依 据 为 n=1 的 情况 。 如 果 只 有 一 项 ,可 以 为 它 任 选 k 个 值 中 的 一 个 。 因 为 =k ， 所 
以 依据 得 证 。 
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归纳 。 假设 命题 S(n) 为 真 , 并 考虑 S(n+1) , 也 就 是 为 n+1 项 分 别 分 配 k 个 值 之 一 , 共有 kk"" 
种 方式 。 可 以 将 这 种 分 配 分 解 为 给 第 一 项 选择 值 ， 以 及 针对 第 一 个 值 的 每 种 选择 ， 为 剩 下 的 7z 
项 分 配 值 。 对 每 种 这 样 的 选择 而 言 ， 根 据 归纳 假设 , 剩 下 的 n 项 及 种 分 配 值 的 方式 。 所 以 总 分 
配方 式 共 有 kxk" 种 ， 也 就 是 有 k”* 种 。 因 此 我 们 证 明了 S(n+1) ， 完 成 了 归纳 步骤 。 

图 4-2 表 示 了 当 n+1=4 且 k=3 时 ， 即 在 示例 4.1 这 个 讨论 4 所 房屋 和 3 种 颜色 的 具体 例子 中 ， 
对 第 一 个 值 的 选择 以 及 相应 的 剩余 项 分 配方 式 的 选择 。 也 就 是 说 , 在 归纳 假设 中 假定 选择 3 种 颜 
色 之 一 粉刷 3 所 房屋 共有 27 种 分 配方 式 。 


第 一 所 房屋 其 余 3 所 房屋 





红 伯 27 种 分 配方 式 





图 4-2 用 3 种 颜色 粉刷 4 所 房屋 的 分 配方 式 数 


4.2.2 ”为 位 串 计数 

在 计算 机 系统 中 ， 我 们 常 遇 到 由 0 和 1 组 成 的 串 ， 而 这 些 串 往往 用 作对 象 的 名 称 。 例 如 ， 我 
们 可 能 购买 具有 “64MB 主 内 存 ” 的 计算 机 。 个 字 节 都 有 自己 的 名 称 ， 而 这 个 名 称 是 长 度 为 
26 位 的 位 序列 ， 每 一 位 要 么 是 0(， 要 么 是 1。 这 种 由 0 和 1 组 成 的 表示 名 称 的 串 就 叫 作 位 串 。 

为 什么 对 64MB 的 内 存 来 说 是 26 位 呢 ? 答案 就 源 自分 配 计数 问题 。 当 我 们 计算 长 度 为 xz 的 位 
串 的 数量 时 ,可 以 将 串 中 的 位 置 视 作 “项 ”而 这 些 位 置 可 能 存放 0 或 1 这 两 个 值 中 的 一 个 。 因 为 
有 两 个 值 ， 所 以 有 k=2 ， 而 为 n 个 项 分 配 二 值 之 一 的 分 配方 式 共 有 >" 种。 

如 果 n=26， 即 考虑 长 度 为 26 的 位 串 ， 就 可 能 有 2” 种 位 串 。2” 的 精确 值 为 67 108 864。 而 
按照 计算 机 的 语法 ,这 个 数字 会 被 视 为 “6 400 万 ”, 虽然 真实 的 数字 显然 要 比 这 个 值 大 上 约 5%。 
接 下 来 的 附注 栏 简 要 介绍 了 该 主题 ， 并 试 着 解释 了 为 2 的 乘 方 命名 时 涉及 的 一 般 规则 。 





























K、M 和 2 的 乘 方 
将 2 的 乘 方 转换 成 10 的 乘 方 有 个 实用 的 技巧 。 我 们 可 以 注意 到 ，2"， 也 就 是 1024， 与 1000 
是 非常 接近 的 。 因 此 ，230 ， 也 就 是 (210) ， 或 者 说 大 概 是 10003 ， 即 10 亿 。 那 么 ，2” = 4X230 ， 
也 就 是 约 40 亿 。 其 实 ， 计算机 科学 家 通常 都 会 认可 2 正好 是 1000 的 假设 ， 并 将 2" 说 成 是 1K， 
其 中 KK 表示 kilo ( 千 ),。 例如 ， 我们 可 将 2 转换 成 32K， 因 为 
25 =2°x2® =32x “1000” 
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而 我 们 将 实际 值 为 1048 576 的 2” 称 为 1M, 或 者 是 1 兆 , 而 不 是 称 为 1000K 或 1024K。 对 2” 
到 2” 这 几 个 2 的 乘 方 数 ， 我 们 会 提取 出 2” 这 个 因子 。 因 此 ，2” 就 是 2 x2”， 或 者 说 是 64 兆 。 
这 正 是 2” 字 节 被 称 为 64 兆 字 节 或 64 MB 的 原因 。 

下 表 给 出 了 多 项 10 的 乘 方 ， 以 及 与 其 近似 相等 的 2 的 乘 方 。 





前 组 字母 值 
Kilo K 103 或 20 
Mega M 10 或 2” 
Giga G 10 或 230 
Tera 工 102 或 24 
Peta 了 105 或 230 


本 表格 表明 对 超过 22 的 2 的 乘 方 ， 我 们 分 别 会 提取 出 230 、24 或 是 可 以 达到 的 2 的 任意 整 
十 次 方 作为 因子 。 不 管用 什么 单位 度量 ， 剩 下 的 2 的 乘 方 会 在 命名 时 加 上 giga- 、tera- 或 peta- 这 
些 前 级 。 例 如 ，2” 字 节 就 是 8TB。 





4.2.3 习题 


(1) 在 下 列 情形 中 ,分 别 有 和 多少 种 粉刷 方式 ? 
(a) 3 所 房屋 ， 每 一 所 可 从 4 种 颜色 中 任 选 一 种 。 
(b) 5 所 房屋 ， 每 一 所 可 从 5 种 颜色 中 任 选 一 种 。 
(c) 2 所 房屋 ， 每 一 所 可 从 10 种 颜色 中 任 选 一 种 。 
(2) 假设 计算 机 密码 由 8 到 10 位 字母 和 (或 ) 数字 组 成 。 可 能 有 多 少 种 不 同 的 密码 ? 请 记 住 ,大 写字 母 
和 小 写字 母 是 不 同 的 。 
(3)* 考虑 如 图 4-3 所 示 的 £ 函 数 。f£ 可 以 返回 多 少 种 不 同 的 值 ? 


int f(int x) 


{ 
int n; 
n= 1; 
if (x%2 == 0) n *= 2: 
if (x%3 == 0) n *= 3; 
if (x%5 == 0) n *= 5; 
if (x%7 == 0) n *= 7; 


if (xh11 == 0) n *= 11; 
if (x%13 == 0) n *= 

if (x%17 == 0) n *= 17; 
if (x%19 == 0) n *= 19; 
return n; 


和 
1 
Es: 
Cn 








图 4-3 于 函数 


(4) 在 “好 莱 坞 广场 ”游戏 中 ，X 和 O 可 能 以 任意 组 合 被 放置 在 井 字 棋 棋 盘 (一 个 3x3 的 矩阵 ) 9 个 格 
子 的 任意 一 个 中 ( 即 与 普通 井 字 棋 玩 法 不 同 的 是 , 这 里 的 X 和 0O 不 必要 交替 摆 放 , 所 以 , 打 个 比方 ， 
所 有 的 格子 都 可 以 放 上 X ) 。 方 阵 也 可 能 为 空 ， 也 就 是 说 ， 既 不 含 X， 也 没有 O。 那 么 有 多 少 种 不 
同 的 摆 放 方法 呢 ? 
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(5) 用 10 个 数字 可 以 组 成 多 少 种 长 度 为 z 的 串 ? 其 中 某 个 数字 可 能 出 现任 意 次 ， 也 可 能 根本 不 出 现 。 

(6) 用 26 个 小 写字 母 可 以 组 成 多 少 种 长 度 为 z 的 串 ? 其 中 某 个 字母 可 以 出 现任 意 次 ， 也 可 能 根本 不 
出 现 。 

(7) 根据 上 文 附 广 栏 中 所 述 的 规则 , 将 以 下 内 容 转 换 成 K、M、G、T 或 P: (a) 2”(b) 2” (c) 2” (qd) 2” 
(e) 245 人 Da , 

(8)* 将 以 下 10 的 乘 方 转换 成 近似 的 2 的 乘 方 : (a) 102 (b) 10' (c) 10”。 


4.3 ”为 排列 计数 


本 市 中 我 们 将 解决 男 一 个 基础 的 计数 问题 ; 将 给 定 的 n 个 不 同 对 象 排 成 一 列 , 可 以 有 多 少 种 
不 同 的 排列 方式 ?这 种 排序 称 为 这 些 对 象 的 排列 。 我 们 将 用 本 (n) 表示 n 个 对 象 的 排列 数 。 

关于 为 排列 计数 在 计算 机 科学 中 的 重要 性 ， 我 们 来 举例 说 明 。 假 设 要 为 给 定 的 n 个 对 象 al、 
a;、"…、a; 排 序 。 如 果 对 这 些 对 象 一 无 所 知 ， 那么 任何 次 序 都 可 能 是 正确 的 排序 次 序 ， 因 此 排序 
可 能 的 结果 数 就 是 I(n) ， 也 就 是 n 个 对 象 的 排列 数 。 我 们 很 快 就 会 看 到 ， 这 一 结果 有 助 于 证 实 : 
通用 的 排序 算法 所 需 的 时 间 与 nlogn 成 正比 ， 并 因此 可 证 实 3.10 节 中 运行 时 间 为 O(nlogn) 的 归 
并 排序 算法 会 快 上 某 个 常数 因子 倍 。 

排列 计数 规则 还 有 很 多 其 他 应 用 。 例 如 ， 我 们 将 在 后 面 的 小 节 中 看 到 的 ， 它 在 组 合 与 概率 
这 样 更 为 复杂 的 计数 问题 中 也 分 量 十 足 。 

+ 示例 4.2 

为 了 直观 , 我 们 列举 一 下 微量 对 象 的 排列 。 首 先 , 显然 有 II(1)=1。 也 就 是 说 ， 如 果 只 有 一 
个 对 象 4， 就 只 有 一 种 次 序 4。 

然后 考虑 有 两 个 对 象 4 和 8 的 情况 。 可 以 从 两 个 对 象 中 任 选 其 一 排列 在 第 一 位 ， 而 将 另 一 个 
对 象 排列 在 第 二 位 ， 因 此 有 两 种 次 序 : 4B 和 B4。 所 以 IC)=2xl=2。 

接着 看 看 有 3 个 对 象 4、B 和 C 的 情况 。 可 以 从 三 者 中 任 选 其 一 排 在 首位 。 先 考虑 选择 4 排 在 
第 一 位 的 情况 ,这 时 候 剩 下 B 和 C 这 两 个 对 象 ， 它 们 可 以 按 两 个 对 象 的 两 种 次 序 之 一 分 布 ， 从 而 
完成 这 一 排列 。 因 此 可 以 看 出 ， 由 4 开头 的 排列 有 两 种 ， 即 4BC 和 4CB。 

类 似 地 ， 如 果 以 B 开 头 ， 也 有 两 种 方式 完成 这 一 序列 ， 对 应 为 剩 下 的 对 象 4 和 C 排 序 的 两 种 
方式 ， 因 此 有 序列 B4C 和 BC4。 最 后 ， 如 果 以 C 开 头 ， 就 可 以 用 两 种 方式 为 剩 下 的 对 象 4 和 8B 排 
序 ， 从 而 得 到 序列 C4B 和 CB4。4BC、4CB、B4C、BC4、C4B 和 CB4 这 6 个 序列 就 是 3 个 元 素 可 
能 排 成 的 所 有 次 序 了 。 也 就 是 说 ，IIG3)=3x2xl=6。 

接 下 来 考虑 一 下 4 个 对 象 4 中 、C 和 D 可 以 形成 多 少 排列 。 如 果 选 择 4 排 在 首位 ,那么 跟 在 4 
之 后 的 对 象 B3、C 和 D 可 以 按照 6 种 次 序 中 的 任意 一 种 排列 。 类 似 地 ， 如 果 将 8 排 在 第 一 位 ， 那 么 
剩 下 的 4、C 和 刀 也 能 按 6 种 次 序 排 列 。 现 在 一 般 模 式 应 该 明了 了 。 可 以 从 4 个 元 素 中 任 选 一 个 排 
在 第 一 位 ， 而 对 每 种 选择 ， 都 可 以 按照 I(3)= 6 种 可 能 方式 中 的 任意 一 种 排列 剩余 元 素 。 请 注 
意 ，3 个 对 象 的 排列 数 并 不 取决 于 这 3 个 元 素 到 底 是 什么 。 由 此 可 以 得 出 绪论: 4 个 对 象 的 排列 数 
等 于 4 乘 以 3 个 对 象 的 排列 数 。 

一 般 而 言 ， 对 任意 n 宇 1， 有 I 了 n+1)= (n+DII(n) (4.1) 
也 就 是 说 ， 要 为 n+1 个 对 和 象 的 排列 计数 ， 可 以 从 n+1 个 对 象 中 任 选 一 个 排 在 首位 。 然 后 剩 下 的 
n 个 对 象 可 以 有 I(n) 种 排列 方式 ， 如 图 4-4 所 示 。 在 我 们 的 例子 中 ，n+1=4 ， 于 是 有 
I1(4) = 4xII(3) = 4x6 = 24 。 
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首 个 对 象 其 余 n 个 对 象 


对 象 ] 一 一 一 一 一 >| IQ) 种 顺序 


图 4-4 ”n+1 个 对 象 的 排列 





对 象 n+1 TI(m) 种 顺序 


4.3.1 排列 公式 


等 式 (4.1) 就 是 2.5$ 节 介绍 的 阶乘 郴 数 定 义 中 的 归纳 步 又。 因此 不 用 为 IC 等 于 n! 感 到 惊讶 。 
我 们 可 以 通过 简单 的 归纳 证 明 这 种 等 价 性 。 
命题 S(n) 。 对 所 有 的 n 宇 1， 有 II(n)=nl!。 
依据 。 对 n=1，S(Q) 表示 1 个 对 象 有 1 种 排列 。 我 们 在 示例 4.2 中 已 经 看 出 这 一 点 了 。 
归纳 。 假 设 IOo = n!。 那 么 要 证 明 的 Sn+]) 就 是 人 n+1)=(n+])!。 由 等 式 (4.1)， 有 
II(n+1)= (n+1)xII(n) 
而 根据 归纳 假设 ，II(n)=n!。 因 此 ，I(n+1)= (n+1])xn!。 因 为 


nl=nx(n—1)x…xl 





所 以 一 定 有 (n+Dxn!= (+Dxnx(-Dx…xl。 而 后 者 的 积 就 是 +D1!， 这 就 证 明了 S(n+1) 
为 真 。 
+ 示例 4.3 


根据 公式 ICODJ = n!， 可 以 得 出 结论 : 4 个 对 象 的 排列 数 是 4!= 4x3x2x1= 24 ， 正 如 我 们 在 
上 面 所 见 的 。 再 举 个 例子 ，7 个 对 象 的 排列 数 就 是 7!= 5040 。 


4.3.2 ”排序 要 花 多 久 


该 排列 计数 公式 有 个 有 趣 的 用 途 , 就 是 可 用 来 证 明 ， 要 为 n 个 元 素 排 序 , 排序 算法 至 少 会 花 
上 与 nlogn 成 正比 的 某 段 时 间 ， 除 非 在 排序 过 程 中 利用 到 这 些 元 素 的 某 些 特殊 属性 。 例 如 ， 在 
后 文 附注 栏 有 关 特 例 排序 算法 的 介绍 中 ， 可 以 注意 到 ， 如 果 编 写 只 处 理 较 小 整数 的 排序 算法 ， 
就 可 以 使 运行 时 间 比 与 nlogn 成 正比 的 值 更 少 。 

不 过 ， 如 果 某 个 排序 算法 可 以 处 理 任意 种 类 的 数据 ， 那 么 只 要 这 些 数据 可 以 通过 某 种 “小 
于 ”关系 进行 比较 ， 该 算法 确定 合适 次 序 的 唯一 方式 就 是 考量 两 个 元 素 中 的 一 个 是 否 小 于 男 一 
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个 。 如 果 某 种 排序 算法 对 待 排序 元 素 的 唯一 操作 是 比较 二 者 以 确定 它们 的 相对 次 序 ， 那 么 这 种 
算法 就 可 称 为 通用 排序 算法 (general-purpose sorting algorithm )。 例 如 ， 第 2 章 中 介绍 的 选择 排 
序 和 归并 排序 都 是 这 样 作出 决定 的 。 即 便 编写 的 程序 是 用 来 处 理 整 数 数据 的 ， 也 可 以 将 其 编写 
得 更 具 一 般 性 ， 只 要 将 图 2-2 第 (4) 行 中 

if (A[j] < A[smalll]) 
这 样 的 比较 替换 成 诸如 

if (lessThan(A[j] ，ALsmal1])) 
这 类 调用 布尔 值 也 数 的 测试 即 可 。 

假设 有 n 个 不 同 的 元 素 有 待 排序 。 管 案 (也 就 是 正确 的 排序 次 序 ) 可 能 是 这 些 元 素 形成 的 n! 
种 排列 中 的 任意 一 种 。 如 果 用 于 为 任意 类 型 的 元 素 排序 的 算法 能 正常 工作 ， 它 就 一 定 能 区 分 这 
n! 种 不 同 的 可 能 答案 。 

考虑 该 算法 进行 的 第 一 次 元 素 比 较 ， 假设 是 

lessThan (X,Y) 
对 这 xn! 种 可 能 的 排序 次 序 而 言 ， 了 对 要么 小 于 Y， 要 人 么 不 小 于 了 Y。 因 此 ， 这 nn! 种 可 能 的 次 序 会 被 划 
分 为 两 组 ， 分别 是 第 一 次 测试 的 答案 为 “是 ”的 组 ， 以 及 答案 为 “ 否 ” 的 组 。 

这 两 组 中 的 一 组 必须 至 少 具有 n!/2 个 成 员 ， 因 为 如 果 两 个 组 的 成 员 都 不 足 n12 个 ， 总 的 次 序数 
就 少 于 nW/2+n1/2 个 ， 也 就 是 少 于 n! 种 次 序 。 而 这 一 次 序数 量 的 上 限 就 限制 了 我 们 刚好 有 n! 种 次 序 。 

现在 考虑 第 二 个 测试 , 假设 对 XY 和 了 进行 比较 的 结果 是 得 出 如 下 结论 : 两 组 可 能 的 次 序 中 较 
大 的 那 组 会 剩 下 〈 如 果 这 两 组 一 样 大 则 任 取 一 组 )。 也 就 是 说 ， 至 少 会 剩余 n!/2 种 次 序 必须 由 算 
法 来 区 分 。 第 二 次 比较 同样 有 两 种 可 能 的 结果 ， 而 且 剩余 的 次 序 中 至 少 有 一 半 会 与 这 些 结果 之 
一 相同 。 因 此 ， 我 们 会 发 现 ， 至 少 有 zu/4 种 次 序 与 前 两 次 测试 的 结果 一 致 。 

可 以 重复 这 一 论证 ， 直 到 算法 确定 正确 的 排序 次 序 为 止 。 在 每 一 步 中 ， 只 要 将 重点 放 在 含 
有 较 多 一 致 可 能 次 序 的 结果 上 ， 就 至 少 会 留 下 一 半 上 一 步 中 得 到 的 可 能 次 序 。 因 此 ， 可 以 看 到 
这 样 一 系列 的 测试 和 结果 : 在 第 次 测试 后 ， 至 少 有 ma/ 2 种 次 序 与 这 些 结 果 相 一 致 。 

因为 直到 每 个 测试 和 结果 序列 最 多 与 一 个 排序 次 序 一 致 才 会 完成 排序 ， 所 以 在 完成 排序 前 
所 进行 测试 的 次 数 丁 满足 

















nl/2'<1 (4.2) 
如 果 对 (4.2) 式 的 两 边 同 时 取 以 2 为 底 的 对 数 ， 就 得 到 log, nl 一 1 三 0 ， 也 就 是 
i 之 log,(n!) 


我 们 将 看 到 log,(n1) 大 约 是 nlog,n 。 不 过 首先 要 看 一 个 分 割 可 能 次 序 的 示例 。 


+ 示例 4.4 

考虑 一 下 图 2-2 所 示 的 选择 排序 算法 在 为 给 定 的 3 个 元 素 ( ap,c ) 排 序 时 是 如 何 作 出 判定 的 。 
第 一 次 比较 发 生 在 a 和 b 之 间 ， 如 图 4-5 中 的 顶端 所 示 ， 其 中 方 框 中 表示 了 进行 任何 测试 前 ，6 种 
可 能 的 次 序 全 部 是 一 致 的 。 在 测试 后 ，abc、acb 和 cab 这 些 次 序 与 结果 为 “是 ”( 即 a<b ) 的 情 
况 一 致 ， 而 bac、bca 和 cab 这 些 次 序 与 相反 的 结果 ( 也 就 是 b>a ) 一 致 。 我 们 再 次 在 方 框 中 展 
示 了 每 种 情况 中 的 一 致 序 (consistent order )。 

在 图 2-2 所 示 的 算法 中 ， 较 小 元 素 的 下 标 成 了 变量 smal1 的 值 。 因 此 ， 接 下 来 要 将 c 与 aq 和 4b 
中 的 较 小 者 进行 比较 。 请 注意 ， 接 下 来 要 进行 何 种 测试 取决 于 上 一 次 测试 的 结果 。 
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在 进行 第 二 次 判定 后 ,3 个 元 素 中 最 小 的 那个 会 被 移动 到 数组 的 第 一 个 位 置 , 而 第 三 次 比较 
则 会 确定 剩 下 的 两 个 元 素 中 哪个 更 大 。 第 三 次 比较 是 该 算法 在 为 3 个 元 素 排序 时 所 要 进行 的 最 后 
一 次 比较 。 正 如 我 们 在 图 4-5 的 底部 看 到 的 ， 有 时 候 判 定 的 结果 是 确定 的 。 例 如 ， 如 果 已 经 得 到 
a<b 而 且 c>b5， 那么 c 就 是 最 小 的 元 素 ， 而 且 最 后 一 次 对 ae 和 2 的 比较 会 得 出 更 小 的 结论 。 


abc, acb, bac, bca, cab, cba 














a=b? 
是 否 
FE 
a<=c? b=<c? 
是 是 否 
EE 


b=c? a<=0b? a? 


Q< a<=0b? 
ee 


图 4-5 ”对 3 个 元 素 进行 选择 排序 的 判定 树 

在 本 示例 中 , 所 有 路 径 都 包含 3 次 判定 ， 而 且 最 后 至 多 存在 一 种 一 致 序 ， 就 是 正确 的 排序 次 
序 。 不 含 一 致 序 的 两 条 路 径 从 未 出 现 。(4.2) 式 说 明 测试 次 数 盖 定 至 少 为 log,3!， 即 log,6 。 由 
于 6 大 于 2 且 小 于 2 ， 所 以 可 知 log, 6 大 于 2 小 于 3。 所 以 ， 为 3 个 元 素 排 序 的 任意 算法 至 少 有 某 
个 结果 序列 必须 进行 3 次 测试 。 因 为 选择 排序 只 需 为 3 个 元 素 进 行 3 次 测试 , 所 以 处 理 3 个 元 素 时 ， 
它 最 不 济 也 至 少 与 其 他 算法 一 样 好 。 当 然 ， 随 着 元 素数 量 不 断 变 多 ， 选 择 排 序 就 不 那么 好 了 ， 
为 它 是 种 O(n?) 的 排序 算法 ， 而 且 还 存在 更 佳 的 算法 ， 比 如 归并 排序 。 

现在 必须 要 估算 log,n! 有 多 大 。 因 为 n! 是 从 1 到 n 这 n 个 整数 的 积 ， 它 肯定 要 比 从 n/2 到 n 这 


了 +1 个 整数 的 积 o 这 二 +1 个 整数 的 积 又 至 少 与 a/2 个 /2 的 积 , 也 就 是 (n/2)” 一 样 大。 





























此 ， log; n! 至 少 是 log2((n/2)”?)， E> (logsn ~log, 2) ， 也 就 是 


了 dog 
对 较 大 的 n 来 说 ， 这 一 公式 约 等 于 (nlog, n)/2。 
更 细致 的 分 析 将 表明 常数 因子 1/2 在 这 里 并 非 必要 。 也 就 是 说 ，1log, n! 非 常 接 近 nlog,n， 
而 非 更 接近 它 的 一 半 。 





线性 时 间 的 专用 排序 算法 
如 果 对 排序 算法 可 以 处 理 的 输入 加 以 限制 ， 就 可 以 在 一 个 步骤 中 将 可 能 的 次 序 分 为 2 个 以 
上 的 部 分 ， 因 此 会 让 运行 时 间 少 于 与 nlogn 成 正比 的 时 间 。 下 面 讲 一 个 简单 例子 ， 如 果 输 入 是 
1 个 从 0 到 2n 一 1 之 间 的 不 同 整 数 ， 它 就 能 起 作用 。 
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(1) for (i = 0; i < 2*n; I++) 
(2) count[i] = 0; 
(3) for (i = 0; i < n; i++) 


(4) count [a[i]]++; 

(5) for (i = 0; i < 2xn; i++) 
(6) if (count[i] > 0) 

(7) printf ("%d\n", i); 


假设 输入 为 长 度 为 n 的 数组 a。 在 第 (1) 行 和 第 (2) 行 ， 我们 将 长 度 为 24 的 数组 count 初 始 化 
为 0。 接 着 ， 在 第 (3) 行 和 第 (4) 行 中 ， 若 x 为 第 i 个 输入 元 素 a[i] 的 值 ， 则 为 x 的 计数 加 上 1。 在 最 
后 3 行 代码 中 ， 要 打印 出 count [i] 为 正 的 各 个 整数 i。 因 此 ， 要 打印 那些 在 输入 中 至 少 出 现 过 
一 次 的 元 素 , 而 之 前 假设 了 输入 中 各 元 素 都 是 不 同 的， 所 以 这 段 代 码 会 将 所 有 的 输入 元 素 按照 
从 小 到 大 的 顺序 打印 出 来 。 

分 析 该 算法 运行 时 间 很 容易 。 第 (1) 行 和 第 (2) 行 是 一 个 会 迭代 2n 次 的 循环 ， 而 且 其 循环 体 
的 运行 时 间 为 O(D) 。 因 此 ， 该 循环 的 运行 时 间 为 O(n) 。 同 理 ， 第 (3) 行 和 第 (4) 行 的 循环 运行 时 
间 也 是 O(n) ,只 不 过 它 的 移 代 次 数 是 na。 最 后 ,第 (5) 行 至 第 (7) 行 所 示 循 环 的 循环 体 运行 时 间 为 
O(n) ， 而 它 会 迭代 21 次 。 因 此 ， 这 3 个 循环 的 运行 时 间 均 为 O(n), 而 整个 排序 算法 的 运行 时 间 
同样 是 O(n) 。 请 注意 ， 如 果 给 定 的 输入 没有 为 该 算法 进行 过 处 理 ， 比 如 输入 中 含有 超出 从 0 到 
27 -1 范围 的 整数 ， 那 么 上 面 的 程序 就 无 法 正确 排序 。 





我 们 只 是 证 实 了 任意 通用 排序 算法 都 一 定 有 某 些 能 让 它们 进行 nlog,n 或 更 多 次 比较 的 输 
和 信 。 因 此， 任意 通用 排序 算法 在 最 坏 的 情况 下 肯定 至 少 要 花 上 与 nlogn 成 正比 的 时 间 。 其 实 ， 
可 以 证 明 ， 这 一 点 同样 适用 于 “平均 的 ”输入 。 也 就 是 说 ， 通 用 排序 算法 处 理 所 有 输入 平均 所 
花 的 时 间 一 定 至 少 与 xlogz 成 正比 。 因 此 ， 归 并 排序 基本 上 就 是 我 们 能 做 的 最 佳 算法 了 ， 因 为 
它 处 理 所 有 输入 都 有 着 这 样 的 大 0 运行 时 间 。 
4.3.3 “习题 
(1) 假设 已 经 为 棒球 队 选 择 了 9 名 队员 。 
(a) 可 能 存在 多 少 种 击 球 次 序 ? 
(b) 如 果 投 手 必须 最 后 击 球 ， 那 么 可 能 有 和 多少 击 球 次 序 ? 
(2) 如 果 要 为 4 个 元 素 排序 ， 那 么 图 2-2 中 的 选择 排序 算法 要 进行 多 少 次 比较 ? 这 是 不 是 可 以 达到 的 最 
优 数字 ? 给 出 该 情况 下 判定 树 (具有 如 图 4-5 所 示 样 式 ) 最 上 面 的 3 层 。 
(3) 2.8 节 介绍 的 归并 排序 算法 在 处 理 4 个 元 素 时 要 进行 多 少 次 比较 ?这 是 否 为 可 达到 的 最 优 数 字 ? 给 
出 该 情况 下 判定 树 (具有 如 图 4-5 所 示 样 式 ) 最 上 面 的 3 层 。 
(4)* 将 z 个 值 分 配给 z 个 项 的 数目 多 , 还 是 n+1 个 项 的 排列 数 多 ? 请 注意 : 对 不 同 的 n 来 说 , 答案 可 能 
不 同 。 
(5)* 将 n/2 个 值 分 配给 n 个 项 的 数目 是 否 多 于 n 个 项 的 排列 数 ? 
(6) ** 说 明 如 何在 O(n) 时 间 内 为 范围 在 0 到 -1 之 间 的 n 个 整数 排序 。 
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有 时 候 我 们 会 希望 只 从 集合 中 选 出 某 些 项 ， 并 为 它们 排 定 顺序 。 这 里 将 4.3 节 中 介绍 过 的 为 
排列 计数 的 函数 IC) 一 般 化 为 双 参 数 的 函数 本 (n,m) ， 用 该 函数 表示 从 xz 个 项 中 选 出 m 项 排 定 次 
序 的 方法 数 ， 不 过 对 未 选 定 的 项 来 说 没有 次 序 可 言 。 因 此 TI(n)=II(n,n) 。 
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+ 示例 4.5 

赛马 比赛 会 为 前 三 名 完成 比赛 的 赛马 颁奖 。 假 设 有 10 匹 马 参赛 ， 那 么 冠 亚 季 和 军 的 排列 
情况 共有 多 少 种 呢 ? 

显然 ，10 匹 马 中 的 任意 一 匹 都 可 能 万 得 比赛 。 如 果 给 定 了 获得 冠军 的 马匹 ， 那 么 剩 下 的 9 
匹 马 可 以 任意 排序 。 因 此 前 两 名 马匹 的 选择 共有 10x9 = 90 种 。 对 每 种 选择 而 言 ， 都 会 剩 下 8 匹 
赛马 ， 其 中 任意 一 匹 都 可 能 获得 季军 。 因 此 ， 冠 亚 季 军 的 选择 方式 共有 90x8=720 种。 图 4-6 
展示 了 所 有 可 能 的 选择 ， 重 点 突出 了 首先 选择 3 号 之 后 选择 1 号 的 情况 。 
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图 4-6 ”从 10 项 有 序 地 选 出 3 项 的 情况 


4.4.1 无 放 回 选择 的 一 般 规 则 

现在 来 推导 一 下 (n,m) 的 公式 。 顺 着 示例 4.5 的 思路 ， 可 知 第 一 次 选择 时 有 nn 种 选择 。 不 管 
第 一 次 作出 了 怎样 的 选择 ， 都 会 璋 下 n-1 个 元 素 有 得 选择 。 因 此 ， 第 二 次 选择 有 nn 一 1 种 不 同 的 
方式 。 前 两 次 选择 总 共有 n(n--1) 种 方式 。 类 似 地 ， 进 行 第 三 次 选择 时 还 剩 z- 2 个 未 选取 的 项 ， 
所 以 第 三 次 选择 共有 7- 2 种 不 同 的 方式 。 因 此 ， 前 三 次 选择 总 共 可 以 有 n(n 一 1)(n 一 2) 种 方式 。 

继续 用 这 种 方式 处 理 ， 直 到 作出 m 次 选择 。 每 次 选择 都 比 之 前 一 次 的 选择 少 一 项 。 结 论 就 
是 ， 从 n 个 项 中 不 放 回 但 有 次 序 地 选 出 m 个 项 ， 总 共有 

IH(n,m)= n(n—1)n—2) (nn—m+l) (4.3) 
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种 不 同 的 方式 。 也 就 是 说 ， 表 达 式 (4.3) 是 从 n 开 始 依 次 倒数 的 m 个 整数 的 积 。 
还 可 以 将 (4.3) 式 写 为 n(n 一 m)!。 也 就 是 
n! nn) nm+l)n—m)(n—m—1).() 
(nm)! (n=—m)(n—m—1)**(D) 
分 母 是 从 1 到 nn- 加 这 些 整数 的 积 。 而 分 子 则 是 从 1 到 n 这 些 整数 的 积 。 因 为 分 子 和 分 母 中 后 
n 一 m 个 因子 (nm)(n 一 m 一 1…() 是 相同 的 ， 所 以 将 这 些 项 约 去 ， 就 得 到 


nl 








Crm) =n(n—1)*…(n—m+1) 


这 一 公式 与 (4.3) 式 是 相同 的 ， 这 样 就 证 实 了 II(n,m) = nl/ (nm)!。 


+ 示例 4.6 
考虑 一 下 示例 4.5 中 的 情况 , 其 中 n=10 且 m=3 。 不 难看 出 , I1(0,3)=10x9x8=720 。 (4.3) 
式 表示 Id0,3) =10V71! ， 或 者 说 是 
lO0Ox9x8x7x6xS5x4x3x2x1 
7x6xSx4x3x2x1 
从 1 到 7 这 些 因数 同时 出 现在 分 子 和 分 母 中 ， 因 此 要 约 去 这 些 因 数 。 结 果 就 得 到 8、9、10 这 三 个 
数字 的 积 ， 就 是 10x9x8 ， 正 如 我 们 在 示例 4.5 中 看 到 的 那样 。 








有 放 回 选择 和 无 放 回 选择 

示例 4.5 中 考虑 的 问题 与 4.2 节 考虑 的 分 配 问题 只 有 细微 的 差别 。 如 果 用 房屋 和 颜色 来 表示 ， 
就 可 以 将 选 出 前 三 名 完成 比赛 的 赛马 视 为 将 10 匹 马 (颜色 ) 分 配给 三 个 完 赛 排 位 (房屋 )。 唯 
一 的 区 别 是 ， 将 多 所 房屋 粉刷 成 相同 颜色 是 可 以 的 ,而 说 一 匹 赛 马 同时 获得 冠军 和 季军 则 很 荒 
唐 。 因 此 ， 用 10 种 颜色 之 一 粉刷 3 所 房屋 的 方法 共有 10?7 或 者 说 是 10x10x10 种 ， 而 从 10 匹 赛马 
中 选择 前 三 名 完成 比赛 的 赛马 则 有 10x9x8 种 方法 。 

有 时 候 我 们 会 将 4.2 节 进行 的 这 种 选择 称 为 有 放 回 选择 。 也 就 是 说 ， 当 为 一 所 房屋 选择 一 
种 颜色 (比如 说 是 红色 ) 后 ,会 将 红色 “ 放 回 ”可 供 选择 的 颜色 池 中 ， 然 后 可 以 继续 为 其 他 房 
屋 再 次 选择 红色 。 

另 一 方面 ， 我 们 在 示例 4.5 中 讨论 的 有 序 选择 被 称 为 无 放 回 选择 。 这 种 情况 下 ， 如 果 赛 马 
“ 硬 面包 ”被 选 作 冠军 ， 那 么 它 就 不 能 被 放 回 含 有 亚军 和 季军 的 马匹 池 了 。 类 似 地 ， 如 果 赛 马 
“秘书 处 ”被 选 为 第 二 名 ， 那 么 它 也 就 不 可 能 再 成 为 获得 季军 的 马匹 了 。 





4.4.2 ”习题 


(1) 从 26 个 字母 中 选 出 m 个 字母 组 成 序列 ， 如 果 不 允 许 同 一 字母 出 现 一 次 以 上 ， 那 么 有 多 少 种 不 同 的 
组 合 方式 ?” 分 别 计 算 六 = 3 及 m = 5 的 情况 。 

(2) 在 一 个 有 200 名 学 生 的 班级 中 ， 我 们 希望 选 出 一 位 会 长 、 一 位 副 会 长 、 一 位 秘书 和 一 位 财务 主管 。 
选择 这 4 位 干部 的 方式 共有 多 少 种 ? 

(3) 计算 如 下 阶乘 之 商 : (a)1001/97! (b) 2001/1951 。 

(4) “ 珠 现 妙 算 ”(Mastermind ) 这 个 游戏 要 求 玩家 选择 一 个 由 一 列 4 个 珠子 组 成 的 “密码 ”， 每 个 珠 
子 都 可 能 是 红 、 绿 、 蓝 、 黄 、 白 和 黑 这 6 种 颜色 中 的 一 种 。 
(a) 总 共有 多 少 不 同 的 密码 ? 
(b*) 有 两 个 或 多 个 珠子 颜色 相同 的 密码 有 多 少 种 ? 提示 : 这 个 量 
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算 的 量 之 间 的 差 。 
(c) 不 含 红 色 珠 子 的 密码 有 多 少 种 ? 
(d*) 不 含 红 色 珠 子 而 且 至 少 有 两 个 珠子 颜色 相同 的 密码 有 多 少 种 ? 
(5)* 通过 对 n 的 归纳 证 明 ， 对 1 和 n 之 间 的 任意 m， 有 I(n,m)=nl (nm)!。 
(6)* 通过 对 a 一 b 的 归纳 证 明 ，al/bl=a(a -D(a-2)…(b+1)。 








阶乘 之 商 
请 注意 ， 一 般 而 言 ， 只 要 p<a ，al/bl 就 是 从 b+1 到 4 这 些 整 数 的 积 。 通 过 计算 
ax(a—l)x*…x(b+]1) 
来 计算 阶乘 之 商 ， 要 比分 别 求 出 每 个 阶乘 的 值 然后 相 除 更 容易 ， 特 别 是 在 0 不比 4 小 很 多 的 情况 下 。 





4.5 无 序 选 择 


在 很 多 情况 下 ， 我 们 希望 计算 出 从 一 组 项 中 进行 选择 到 底 有 多 少 种 方法 ， 而 其 中 所 选项 的 
顺序 倒是 无 关 紧 要 。 按 照 4.4 节 中 赛马 结果 示例 的 说 法 ,我 们 可 能 想 知 道 前 三 名 完成 比赛 的 赛马 
是 哪 三 匹 ， 但 不 关心 到 底 哪 严 马 顾 得 了 哪个 名 次 。 换 句 话 说， 就 是 想 知 道 从 zx 匹 赛 马 中 选 出 3 匹 
作为 前 三 名 完成 比赛 的 马匹 ， 方 法 有 多 少 种 。 


+ 示例 4.7 
再 次 假设 n=10 。 我们 从 示例 4.5 中 得 知 ， 选 择 3 匹 赛马 , 假设 说 是 4、B 和 C, 分 别 作 为 冠 亚 
季军 的 方式 共有 720 种 。 然 而 ， 我 们 现在 不 关心 这 3 匹 马 完成 比赛 的 具体 次 序 ， 只 是 想 知道 4、B 
和 C 这 3 匹 马 以 某 种 次 序 获 得 了 前 三 名 。 因 此 ， 我 们 将 通过 6 种 不 同 的 方式 得 到 答案 “4、B 和 C 
是 最 好 的 3 匹 赛马 ”, 分 别 对 应 3 匹 马 在 前 三 名 中 6 种 不 同 的 排 位 。 可 知 刚好 存在 6 种 方法 ， 因 为 给 
3 个 项 排序 的 方法 为 IG) = 3!1= 6 种。 如 果 还 有 疑问 的 话 ， 可 以 参考 图 4-7 所 示 的 这 6 种 方法 。 
冠军 ”亚军 ”季军 
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图 4-7 3 匹 马 完成 比赛 的 6 种 顺序 
对 4、B 和 C 这 3 匹 马 来 说 成 立 的 情况 ， 对 任意 一 组 3 匹 马 来 说 都 成 立 。 在 为 从 10 匹 马 中 有 序 
选择 出 3 匹 马 的 情况 计数 时 , 每 一 个 3 匹 马 构 成 的 组 都 会 刚好 按照 它们 可 能 形成 的 所 有 次 序 出 现 6 
次 。 因 此 , 如 果 只 需要 计算 可 能 为 前 三 名 的 3 匹 马 的 组 合 数 , 就 还 要 在 IQ0，3) 的 基础 上 除 以 6。 
因此 ， 从 10 匹 马 中 选 出 3 匹 作为 前 三 名 的 马 共 有 720716 = 120 种 不 同 组 合 。 


+ 示例 4.8 

再 来 考虑 一 下 扑克 牌 型 的 数量 。 在 扑克 牌 游戏 中 ， 每 名 玩家 都 会 分 到 从 52 张 牌 中 发 出 的 5 
张 。 这 里 不 用 考虑 分 到 的 5 张 牌 究 竞 是 什么 顺序 ， 只 关心 拿 到 的 这 5 张 牌 到 底 是 哪 5 张 。 要 计算 
分 到 的 5 张 牌 可 能 有 多 少 种 情况 ， 可 以 先 从 计算 I(52, 5) 开始 ， 也 就 是 从 52 个 对 象 中 有 序 选 择 5 个 
对 象 的 情况 总 数 。 这 一 数字 是 $2!/($2- 5)! ， 就 是 521/ 47! ,或 者 说 是 50x49x48 =311 875 200 。 
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不 过 ， 就 像 示 例 4.7 中 跑 得 最 快 的 3 匹 马 总 共 可 能 以 31= 6 种 次 序 出 现 那样 ， 任 意 一 组 $ 张 牌 都 
可 能 以 ICS) = S!= 120 种 不 同 的 次 序 出 现 。 因 此 ， 要 在 不 考虑 选择 次 序 的 情况 下 考虑 可 能 构成 的 
牌 型 , 就 必须 用 有 序 选择 的 次 数 除 以 120。 结果 是 共有 311 875 200/120 = 2 598 960 种 不 同 的 牌 型 。 
4.5.1 为 组 合计 数 

现在 要 将 示例 4.7 和 示例 4.8 中 介绍 的 情况 一 般 化 , 以 得 出 在 不 考虑 选择 顺序 的 情况 下 计算 从 


n 项 中 选 出 m 项 的 方法 数 的 公式 。 这 一 函数 通 第 可 号 | 并 说 成 是 “n 选 m” 或 是 “从 n 个 元 


n 
m 





来 中 这 取 m 个 元 素 的 组 台数 ”。 要 计算 | ”| ， 首 先 要 计算 (0m) = aa/ Cn 一 0)! ， 也 就 是 从 x 个 事 
物 中 有 序 选择 出 m 个 的 方法 数 。 然 后 要 根据 选 出 的 这 m 项 来 为 这 些 有 序 选择 分 组 。 因 为 这 m 项 可 
以 有 TIGm) =m! 种 不 同 的 次 序 ， 所 以 这 些 分 组 中 各 含 m! 个 成 员 。 要 得 到 无 序 选择 的 数目 ， 就 必 
须要 用 有 序 选择 的 数目 除 以 w! ， 也 就 是 


| (4.4) 
m II(m) (nn—-m)lxml! 





+ 示例 4.9 
回顾 一 下 示例 4.8, 它 用 到 了 公式 (4.4), 其 中 n=52 I ，m=5。 于 是 有 的 =52!(47x5!) 。 


如 果 将 47! 与 52! 中 的 后 47 个 因数 约 去 ， 并 展开 5!， 就 可 以 写 为 
[3 52x51x50x49x48 


5) Sx4x3x2x1 


4.5.2 ”nn 选 m 的 递归 定义 


如 果 间 旧地 考虑 内" 项 中 选 出 m 项 的 方法 数 ， 就 可 以 得 出 计算 | ”] 的 有 和 法。 

依据 。 对 任意 ?学 1， 有 | "|- 1 也 就 是 说 , 从" 顶 中 过 择 0 项 只 有 一 种 方式, 此 外 ,| ”]=1 
也 就 是 说 ， 从 项 中 选择 项 的 唯一 方法 就 是 将 它们 都 选 上 。 

归纳 。 如 果 0<m<n， wz" |- ("je 也 就 是 说 ， 如 果 想 从 /项 中 选 出 项 ， 
可 以 用 以 下 两 种 方法 中 的 任 一 种 。 

CD 不 和 了 第 一 个 元 素 ， 搂 痢 从 利 下 的 9-1 个 元 素 中 选取 wm 个 | ”| 这 项 表示 的 就 是 这 种 
情况 下 可 能 的 选择 方法 数 。 

选取 第 一 个 元 素 ， 然 后 从 利 下 的 -1 个 元 素 中 选取 1 个 元 素 。[ ”| 这 项 志 示 的 就 
是 这 种 情况 下 可 能 的 选择 方法 数 。 
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顺便 提 一 句 ， 尽 管 归 纳 部 分 的 概念 应 该 很 明确 〈 先 从 全 选 或 全 不 选 的 最 简单 情况 开始 ， 进 
而 处 理 选 择 某 些 元 素 的 更 复杂 的 情况 ), 不 过 还 是 要 谨慎 起 见 , 说 明 是 对 什么 量 进行 归纳 。 看 待 
这 一 归纳 的 方式 之 一 是 ， 将 其 视 为 对 mm 和 7- 六 二 者 中 较 小 的 那个 与 z 的 积 进行 完全 归纳 。 那 么 
当 该 积 为 0, 而 且 归 纳 是 针对 该 积 的 较 大 值 进行 时 ,就 会 发 生 依据 的 情况 。 我 们 还 必须 为 归纳 过 
程 核 实 ， 当 0<m<n 时 ， nxmin(m,n-m) 总 大 于 (n-])xmin(m,n-m-1l) 以 及 
(n 一 xmin(m 一 1,n 一 m) 。 这 一 验证 过 程 将 留 作 本 节 的 习题 。 

这 种 递归 关系 通常 是 用 帕斯卡 三 角形 ( Pascal’s triangle ) 4 表示 的 ， 如 图 4-8 所 示 ， 其 中 两 条 
边 全 部 由 1 构成 (表示 依据 )， 而 三 角形 中 每 个 内 部 条 目 都 是 它 左 上 角 和 右上 角 相 邻 条 目 之 和 。 


凶 么 | ”| 将 作为 第 (n+4DD 行 的 第 (m+DD 个 条 目 被 读 取 。 

















1 4 6 4 1 
图 4-8 ”帕斯卡 三 角形 的 前 几 行 


+ 示例 4.10 
考虑 -下 n=4 且 m=2 的 情况 。 我 们 在 图 4.8 第 5 行 的 第 3 个 条 目 处 找到 了 | 的 值 。 该 条 目 


为 6， 而 很 容易 验证 | >| =4V/V(2K20=24/(2x2)=6。 





通过 公式 (4 仿 或 是 上 述 吉 有 这 丙种 方 法 计算 ”] ， 守 算出 的 自然 是 相同 的 信 。 可 以 通过 泊 
m 


诸 物理 推理 (physical reasoning ) 来 证 实 这 一 点 。 两 种 方法 计算 的 都 是 从 n 项 中 无 序 选择 m 项 的 
方法 数 ， 所 以 一 定 会 得 出 相同 的 值 。 不 过 ,还 可 以 通过 对 nn 的 归纳 证 明 这 两 种 方式 的 等 价 性 。 在 
这 里 将 该 证 明 过 程 留 作 本 节 的 习题 。 


4.5.3 计算 | ”| 的 算法 的 运行 时 间 
正如 在 示例 4.9 中 所 见 ， 当 我 们 使 用 公式 (4.4) 计 算 上 时 ， 可 以 约 去 分 母 中 的 (nm)! 和 分 
m 


子 中 ml 的 后 4 加 个 因数 ， 将 | ”| 表示 为 


n _ nx(n-Dx*x(n-m+)) (4.5) 
m mx(m—1)x:…x!l 
如 果 mt 比 an 小， 那么 使 用 上 述 公 式 进行 计算 要 比 用 公式 (4.4) 计 算 更 快 。 大 体 上 讲 ， 图 4-9 中 的 C 语 
言 代 码 段 就 是 用 来 完成 这 一 工作 的 。 


第 (0 行将 < 初始 化 为 1，< 就 成 为 了 结果 一 | | ,第 9) 行 和 第 G) 行 会 给 c 乘 上 从 nm+1 到 








J 又 称 杨辉 三 角 或 页 宪 三 角 。 译 者 注 
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n 的 各 个 整数 。 然 后 ， 第 (4) 行 和 第 (5) 行 会 依次 从 c 除 去 从 2 到 mm 的 各 个 整数 。 因 此 ， 图 4-9 就 实现 
了 (4.5) 式 中 的 公式 。 

要 计算 图 4-9 的 运行 时 间 ， 只 要 注意 到 第 (2) ~ (3) 行 及 第 (4) ~ (5) 行 这 两 个 循环 ， 每 个 循环 都 
会 迭代 m 次 ， 而 且 循 环 体 的 运行 时 间 都 是 OQ) 。 因 此 ， 运 行 时 间 是 O(m) 。 








(1) © et 

(2) for (i = ni i > n-m; i--) 
(3) C *= i; 

(4) for (i = 2; i <= m; i++) 
(5) c /= i 





图 49 计算 国 的 代码 
在 m 接 近 n 而 n 一 m 很 小 的 情况 下 ， 可 以 交换 m 和 nn 一 m 的 角色 。 也 就 是 说 ， 可 以 约 去 n! 和 ml! 的 
因数 ,得 到 n(n 一 1…(m+1) ， 并 将 其 除 以 (一 m)!。 该 方法 给 出 了 (4.5) 所 示 公 式 的 男 一 种 形式 ， 即 
|= nx(n-Dx…x(m+]l) (4.6) 
mj) (n—-m)x(n—-m—1)x…x!l 


同样, 存在 与 图 49 关 位 的 代码 段 玉 实 现 公式 4. 而且 所 花 的 时 间 为 OC) ,因为 可 定 久 ”| 
m 


就 一 定 有 nm 和 mm 不 大 于 n， 所 以 不 管 是 哪 种 方式 ，O(n) 都 是 运行 时 间 的 边界 。 此 外 ， 在 m 接 
近 0 或 者 接近 n 时 ， 两 种 方法 中 更 优 方法 的 运行 时 间 都 要 大 大 小 于 O(n) 。 

不 过 ， 图 4-9 有 个 重大 缺陷 。 它 先 要 计算 奋 干 整数 的 积 ， 然 后 再 将 其 除 以 相同 数量 的 整数 。 
因为 普通 的 计算 机 运算 只 能 处理 有 限 大 小 的 整数 (通常 , 一 个 整数 最 大 可 以 达到 约 20 亿 )， 所 以 
因 4.9 第 G) 生 计算 中 加 结果 的 过 程 可 能 有 江 出 到 数 大 小 限制 的 风险 。 印 使 是 在 ”| 的 信 足 外， 


n 
m 
可 以 在 某 计算 机 中 表示 出 来 的 情况 下 ， 也 还 是 可 能 出 现 这 种 情况 。 
更 好 的 方式 是 让 乘法 和 除法 交替 进行 。 首 移 乘 上 2 ， 然 后 除 以 m。 乘 上 7m -1 ， 再 除 以 闫 -1 ， 
以 此 类 推 。 这 种 方法 的 问题 在 于 ， 我 们 没 理由 相信 每 一 阶段 的 计算 结果 都 是 整数 。 例 如 ， 在 示 
例 4.9 中 ， 首 先 要 乘 上 52 并 除 以 5， 这 个 结果 就 已 然 不 是 整数 了 。 因 此 ， 在 进行 任何 计算 前 都 需 
要 转换 为 浮 点 数 。 在 这 里 将 这 一 修改 留 作 本 市 的 习题 。 











让 ”一定 得 出 问 数 的 公式 
m 

要 看 出 为 什么 (4.4)、(4.53) 和 (4.6) 这 几 个 式 子 中 多 个 因数 的 商 一 定 是 整数 可 能 不 容易 。 唯 一 
的 简单 论证 就 是 诉 诸 物 理 推理 。 这 些 公式 都 是 计算 从 n 个 事物 中 选取 mm 个 的 方法 数 ， 而 这 个 数 
字 一 定 是 菜 个 整数 。 

不 借助 这 些 公式 的 物理 意义 ， 而 从 整数 的 属性 来 论证 这 一 事实 ， 要 难 上 很 多 。 其 实 可 以 通 
过 仔细 分 析 分 子 和 分 母 中 各 质数 因子 数 来 证 明 这 一 事实 。 拿 示例 4.9 中 的 表达 式 当 例子 。 其 中 
分 母 中 有 5 这 个 因数 ， 而 分 子 中 有 5 个 因数 ， 由 于 这 些 因数 是 连续 的 ， 可 知 其 中 必 有 一 个 能 被 5 
整除 ， 而 它 正 好 是 中 间 的 那个 因数 -50。 因 此 ， 分 母 中 的 $ 肯 定 会 被 约 去 。 








现在 来 考虑 计算 | ”| 的 有 算法。 可 以 通过 图 4-10 所 示 的 简单 递 月 本 数 来 实现 这 一 算法。 
m 
图 4-10 中 的 函数 效率 不 高 , 因为 它 调用 choose 的 次 数 会 嘲 指 数 级 增长 。 原因 就 在 于 当 使 用 
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n 作 为 首 个 参数 调用 该 函数 时 ,往往 会 在 第 (6) 行 用 nn 一 1 作为 首 个 参数 进行 两 次 递归 调用 。 因 此 ， 
可 以 预见 ， 当 nn 增 加 1 时 ， 调 用 的 次 数 就 会 翻 倍 。 而 且 弟 归 调 用 的 确切 次 数 是 很 难 计算 的 。 原 因 
在 于 第 (4) 行 和 第 (5) 行 的 依据 情况 不 仅 适用 于 n=1 的 情况 ,而 对 更 大 的 n, 会 提供 值 为 0 或 n 的 m。 

下 面 要 证 明 一 个 简单 但 稍 显 悲观 的 上 界 。 设 7(o) 是 当 首 个 参数 为 时 图 4-10 所 示 程 序 段 的 运 
行 时 间 。 可 以 直接 证 明 7(o) 是 0(2") 。 假 设 a 是 第 (1) 行 到 第 (5) 行 ,加 上 第 (6) 行 涉及 调用 与 返回 的 
部 分 (不 含 递归 调用 本 身 所 花 的 时 间 ) 的 总 运行 时 间 。 然 后 就 可 以 通过 对 n 的 归纳 证 明 下 列 合 题 。 


























/* 对 0 <= m <= n, 计算 从 nn 个 元 素 中 选择 m 个 的 方法 数 */ 
int choose(int n, int m) 
{ 
int n, m; 
(1) if (m< 0 || m > n) {/* 错误 的 条 件 */ 
(2) printf ("invalid input\n'"); 
(3) return 0; 
} 
(4) else if (m == 0 || m == n) /* 依据 情况 */ 
(5) return 1; 
else /* 归纳 */ 
(6) return (choose(n-1, m-1) + choose(n-1, m)); 








图 4-10 计算 | 的 进 上 本 数 


n 
m 


命题 $S(n) 。 如 果 用 第 一 个 参数 n 以 及 在 0 和 n 之 间 的 第 二 个 参数 m 调 用 choose， 那 么 该 调用 
的 运行 时 间 7(n) 至 多 为 a(2” -1) 。 

依据 。n =1。 那 么 一 定 有 m= 0 或 m=1=n。 因 此 ,依据 情况 适用 于 第 (4) 行 和 第 (5) 行 ， 而且 
没有 进行 递归 调用 。 第 (1) 行 到 第 (5) 行 的 时 间 都 包含 在 a 中 ,因为 SQ) 是 说 7T() 至 多 为 a(2 -D =a。 

归纳 。 假 设 S(n) 成 立 ， 也 就 是 有 7T(n) 三 a(2” -1)。 要 证 明 S(n+]) 成 立 ， 假设 要 以 n+1 为 
首 个 参数 调用 choose。 那 么 图 4-10 所 示 程 序 段 花 的 时 间 就 是 az 加 上 第 (6) 行 两 次 递归 调用 的 时 间 。 
根据 归纳 假设 ,每 次 调用 花费 的 时 间 至 多 为 (2” -1) 。 因 此 ， 消 耗 的 总 时 间 最 多 是 : 

at2a(2 =D=a(l+2" = =a(2™ =D) 

这 一 计算 过 程 就 证 明了 S(n+]) 成 立 ， 并 证 明了 归纳 步骤 。 

因此 证 明了 7(n) 三 a(2” -1)。 舍 去 常数 因子 及 低 阶 项 ， 就 可 以 得 出 7T(n) 是 0(2”) 的 结论 。 

奇怪 的 是 ， 尽 管 在 第 3 章 的 分 析 中 ， 很 容易 就 证 明了 运行 时 间 的 平滑 紧 上 界 , 但 7(n) 上 的 
边界 0(2”) 昌平 滑 却 不 紧凑 。 合 适 的 平滑 紧 上 界 要 稍 小 一 些 一 一 0(2"Vm) 。 要 证 明 这 一 事实 相 
当 困 难 ， 不 过 在 这 里 要 留 一 个 更 为 简单 的 事实 作为 习题 来 证 明 ， 就 是 图 4-10 所 示 程 序 段 的 运行 


时 间 与 它 返 回 的 信 ”| 成 比例 要 看 到 图 4.10 中 的 递归 算法 ， 效 率 要 比 图 4.9 中 的 算法 低 得 多 。 
这 是 一 个 递归 严重 不 靠 谱 的 例子 。 

















4.5.4 [| 函数 的 图 像 


对 某 个 固定 的 值 n 而 言 ， "的 本 数 | | 用 不 少 有 意思 的 属性 。 对 于 值 比较 大 的 n 来 说 ， 如 


n 
m 
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图 4-11 所 示 ， 其 图 像 为 一 条 钟 形 的 曲线 。 我 们 很 容易 看 出 函数 图 像 是 关于 中 点 /12 所 在 轴线 对 
称 的 ， 运 用 声明 国 1， 网 的 公式 (4.4) 很 容易 证 实 这 一 点 。 





最 大 高 度 处 于 中 心 位 置 ， 也 就 是 | po 大 约 是 2”/ yxn/2 。 例 如 ， 寿 n=10 ， 这 一 公式 
n 


10 
可 以 得 出 258.37， "| g | =252 。 





该 曲线 的 “ 厚 部 ”是 中 点 两 边 各 约 Vn 的 范围 。 例如 , 如 果 n =10 000 , 那么 对 处 在 4900 和 5100 
之 间 的 m， [na 而 对 这 个 范围 之 外 的 mw 来 说 ， | 的 信 会 下 隆 得 特别 迅速 


二 


~ 


2 2 以 T1WMW 2 


图 4-11 "为 加 定 什 的 | 函数 


4.5.5 ”二 项 式 系数 
二 下 | ”| 除了 可 以 用 来 计数 外 ，3 还 能 提供 二 项 式 系 数 。 在 展开 二 项 式 的 乘 方 (比如 (x+y)" ) 


时 ， 就 会 看 到 这 些 数字 。 
在 展开 (x+y)" 时 ， 会 得 到 >" 个 项 ， 其 中 每 一 项 都 是 x"y”” 这 样 的 形式 ( m 是 0 到 n 之 间 的 茶 
整数 )。 也 就 是 说 ， 对 每 个 因 式 x+y ， 都 可 能 从 x 和 y 中 任 选 其 一 作为 某 个 特定 项 的 因子 。 展 
= y”” 的 系数 是 由 m 个 x 和 其 余 n+m 个 y 组 成 的 项 的 数量 。 


+ 示例 4.11 

考虑 一 下 n=4 的 情况 ， 也 就 是 看 看 (x+y)(x+y)(x+y)(x+y) 的 积 。 

总 共有 16 项 ， 其 中 只 有 1 项 是 x*y”( 也 就 是 x* )。 如 果 从 4 个 因 式 中 都 选 出 x， 就 能 得 到 这 一 
项 。 男 一 方面 ， 有 4 项 是 x*y ， 对 应 的 情况 是 从 4 个 因 式 的 任意 一 个 中 选 出 y， 再 从 其 余 3 个 因 式 
中 选 出 x。 对 称 地 ， 有 1 项 是 y ， 有 4 项 是 xy 。 

那么 有 多 少 项 是 xy? 呢 ? 如 果 从 两 个 因 式 中 选取 x 并 从 其 余 两 个 中 选取 y。 就 能 得 到 这 样 一 
项 。 因 此 ， 必 须要 计算 从 4 个 因 式 中 选择 两 个 因子 的 方法 数 。 因 为 选择 两 个 因子 的 顺序 是 不 产生 


影响 的 ， 外 个 数字 就 是 ?| =4V(2x20=24/14=6。 因 此 ,有 6 项 是 六 7 。 完 整 的 展开 式 就 是 








(x+y) =x4 +4xiy+6x’y’ +4xy’ +y’ 
请 广 意 等 式 右 侧 各 项 的 系数 ，( 4 6, 4, 1 ) ， 正 好 就 是 图 4-8 中 帕斯卡 三 角形 的 一 行 。 我 们 会 看 
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到 ， 这 并 非 巧 合 。 
示例 4.11 中 用 于 计算 x?y? 系数 的 概念 可 以 推广 开 来 。((x+y) 展开 式 中 的 项 x"y”” 的 系数 为 


人 原因 在 于 ,只 要 从 n 个 因 式 中 选 出 m 个 x 并 选 出 n-m 个 y， 就 可 以 得 到 x”y”” 这 一 项 。 从 n 





个 天 式 中 活 thm 个 办 于 的 方式 有 |[ | 加 


n 
m 





在 二 项 式 系数 和 国 函数 之 间 还 有 一 种 有 趣 的 关系 。 我 们 已 经 看 出 
人 | 


m=0 


令 x=y=1， 那么 有 (x+y) =2”。x 和 和 y 的 所 有 乘 方 都 是 1， 所 以 上 述 等 式 就 成 了 





n 加 
| 
换 句 话说 ,对 某 个 特定 的 n 而 言 ， 所 有 二 项 式 系数 的 和 就 是 2"。 特 别 要 说 的 是 ， 每 个 素数 | "| 都 


n 

m 
方 的 区 域 表 示 2”， 因 此 能 看 出 为 什么 只 有 接近 中 点 的 一 些 值 会 比较 大 。 
4.5.6 ”习题 


小 于 2 。 图 4-11 就 暗示 了 ， 对 接近 /2 的 m 来 说， | 和 2 特别 扩 近 由 于 在 图 4-11 中 曲线 下 





ake 7 8 10 12 

(1) 计算 以 下 各 值 : (a) | ; (b) 日 ; (©) 上 | ; (d) 辣 5 

(2) 从 26 个 小 写字 母 中 选 出 5 个 不 同 字母 的 方法 共有 多 少 种 ? 

(3) 如 下 系数 各 为 多 少 ? 
(a) (x+y) 的 展开 式 中 产 ) ”的 系数 ; 
(b) (x+ 二 的 展开 式 中 产 太 的 系数 。 

(4)* 在 Real Security 人 公司， 计算 机 密码 必须 由 4 位 数字 ( 10 选 4 ) 和 6 个 字母 ( 52 选 6 ) 组 成 ， 字 母 和 数 
字 都 可 以 重复 。 总 共 可 能 有 多 少 种 不 同 的 密码 组 合 ? 提示 : 首先 考虑 选择 4 个 存放 数字 的 位 置 共 有 
多 少 种 方法 。 

(5) * 5 个 字母 组 成 的 双 元 音 序列 有 多 少 种 ? 

(6) 重新 编写 图 4-9 所 示 的 程序 片段 ， 从 而 利用 nm 小 于 n 的 情况 。 

(7) 重新 编写 图 4-9 所 示 的 程序 片段 ， 并 将 其 转换 成 浮 点 数 乘除 交 蔡 的 算法 。 

(8) 证 明 : 如 果 0 三 m 三 n， wa j-| _ | 


n 
m n—m 
n 
m 
(b) 利用 (4.4) 式 。 
(9)* 通过 对 m 的 归纳 ， 证 明 | | 的 递归 定义 正确 地 定义 了 | | nl ((n—m)xm!) 。 


n n 
m m 


(a) wl | 的 含义 。 








(10) ** 通过 对 m 的 归纳 ,证 明 图 4-10 中 递归 函数 choose (n,m) 的 运行 时 间 最 多 是 c | "] , 其 中 c 为 某 个 常数 。 
m 
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(11) * 证 明 : 当 0<m<n 时 ，nxmin(m,n 一 m) 总 是 大 于 (n-Dxmin(m,n-m--1) 和 (n 一 1)x 


min(m—1,n—m) 。 


4.6 ”相同 项 的 次 序 


在 本 节 中 , 要 处理 的 是 这 样 一 些 选择 问题 , 其 中 含有 一 些 相同 项 , 但 不 同 项 出 现 的 次 序 很 重要 。 
而 在 接 下 来 的 4.7 节 中 ， 则 要 解决 一 类 类 似 的 选择 问题 ， 即 有 一 些 相同 项 ， 而 且 项 的 次 序 无 关 紧 要 。 


+ 示例 4.12 

构 词 (anagram ) 猜谜 游戏 会 给 出 一 列 字 母 ， 让 玩家 重新 排列 字母 以 构成 单词 。 如 果 拥 有 含 
规范 单词 的 字典 ， 并 能 生成 所 有 可 能 的 字母 序列 ， 就 可 以 通过 计算 机 解决 该 问题 。 第 10 章 会 介 
绍 判定 给 定 字母 序列 是 否 处 于 字典 中 的 有 效 方法 。 不 过 现在 要 考虑 的 是 组 合 问题 ， 可 能 首先 要 
确定 有 多 少 单词 需要 用 字典 验证 其 确实 存在 。 

对 有 些 构 词 来 说 ， 计 数 很 简单 。 假 设 有 abenst 6 个 字母 ， 可 能 会 有 II(6) = 6!= 720 种 不 同 
的 次 序 ， 其 中 之 一 便 是 absent， 也 就 是 该 这 题 的 “解答 ”。 

不 过 ， 构 词 游戏 通常 会 含有 重复 的 字母 。 考 虑 一 下 谜 题 eijl11tt。 这 些 字母 就 不 能 构成 720 
种 不 同 的 序列 。 例 如 ， 交 换 两 个 字母 t 的 位 置 似 乎 并 不 能 让 单词 发 生变 化 。 

假设 对 两 个 t 和 两 个 1 加 以 标记 以 区 分 这 些 字 母 ， 分 别 将 其 记 为 t,、t,、1, 和 1,。 被 标记 的 
字母 可 能 有 720 种 次 序 。 然 而 ,这 些 标记 过 的 ] 仅 在 位 置 上 有 区 别 , 诸如 1,it,t,1,e 和 1,it,t,1,e 
就 并 不 是 真 的 有 区 别 。 因 为 所 有 720 种 次 序 可 以 平分 为 两 组 ， 这 两 组 的 区 别 只 在 于 1 的 下 标 ， 所 
以 可 以 证 明 : 如 果 将 字母 串 的 数量 除 以 2， 这 些 1 其 实 都 是 相同 的 。 

类 似 地 ， 在 字符 串 中 只 有 字母 t 带 标记 时 ， 可 以 将 只 有 tt 的 下 标 不 同 的 字符 串 配 对 。 例 如 ， 
1Litit1e 和 1itit1e 就 是 一 对 。 因 此 ， 如 果 再 将 数目 除 以 2， 就 可 以 得 到 将 上 和 1 的 标记 删除 后 
不 同 构 词 串 的 数量 。 该 数字 为 360/2=180。 即 使 用 ei1l1tt 共 有 180 种 不 同 的 构 词 方法 。 

我 们 可 以 将 图 4-12 中 的 概念 一 般 化 为 有 n 个 项 而 且 这 些 项 被 分 为 组 的 情形 。 各 组 中 的 成 员 
都 是 相同 的 , 而 不 同 组 的 成 员 则 是 不 同 的 。 在 这 里 假设 m 是 第 ;组 中 的 成 员 项 , 其 中 i=1,2,…,k 。 


+ 示例 4.13 

重新 考虑 示例 4.12 中 用 eilltt 构 词 的 问题 。 其 中 共有 6 项 ， 也 就 是 说 n= 6 。 而 分 组 的 数量 
k 为 4， 因 为 有 4 个 不 同 的 字母 。 这 4 组 中 有 两 组 含有 一 个 成 员 (e 和 i )， 而 男 两 组 则 含 两 个 成 员 。 
因此 可 以 取 = =1, =i=2。 

如 果 为 这 些 项 加 上 标记 ,以 使 同一 组 中 的 成 员 有 所 不 同 ,那么 会 有 n! 种 不 同 的 次 序 。 不 过 ， 
若 第 一 组 中 有 i 个 成 员 ， 那 么 这 些 标记 过 的 项 可 能 会 以 i! 种 不 同 的 次 序 出 现 。 因 此 ， 在 从 第 一 
组 的 项 上 移 除 标 记 时 ， 我 们 要 将 这 些 次 序 分 成 大 小 同 为 i! 的 集合 。 因 此 必须 将 次 序数 除 以 计 !， 
从 而 得 到 从 第 1 组 删除 标记 后 的 次 序数 。 

类 似 地 ， 依 次 从 各 组 中 删除 标记 需要 将 不 同 次 序 的 数量 除 以 iz!、 除 以 isa!， 等 等 。 对 那些 值 
为 1 的 计 来 说 ， 就 是 除 以 1! = 1， 因 此 没有 任何 有 影响。 不过， 对 那些 所 含 项 数 大 于 1 的 分 组 来 说 ， 
我 们 必须 除 以 分 组 大 小 的 阶乘 ， 这 就 是 示例 4.12 中 的 情况 。 有 两 组 中 包含 1 个 以 上 的 元 素 ， 而 每 
组 的 大 小 都 是 2， 所 以 就 要 除 以 2! 两 次 。 可 以 通过 对 K 的 归纳 证 明 该 一 般 规则 。 

命题 S(X) 。 如 果 有 n 个 项 ， 并 且 分 别 被 分 为 大 小 为 计 、 计 、…、 的 k 个 组 ， 同 一 组 中 的 项 是 
相同 的 ， 而 不 同 组 中 的 项 是 不 同 的 ， 那 么 这 个 项 能 形成 的 不 同 次 序 的 数目 为 
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(4.7) 





依据 。 如 果 k =1 ， 那 么 只 有 一 组 无 区 别 的 项 ,不 管 x 有 多 大 都 只 有 一 种 次 序 。 如 果 k=1， 
那么 i 一 定 为 x"， 而 (4.7) 式 就 变 成 了 nlWn!， 也 就 是 1。 因 此 ，SQ) 成 立 。 

归纳 。 假 设 S(1) 为 真 ， 并 考虑 有 k+1 个 分 组 时 的 情况 。 设 最 后 一 组 中 有 m=i, 个 成 员 。 
这 些 项 将 会 出 现在 m 个 位 置 , 而 且 可 以 有 国 种 不 同 的 方式 来 选择 这 些 位 置 。 一旦 选 定 了 m 个 位 
置 ， 把 最 后 一 组 中 的 哪 一 项 放 在 这 些 位 置 都 没关系 了 ， 因 为 这 些 项 都 是 没有 区 别 的 。 

在 为 最 后 一 组 选择 了 位 置 后 ， 还 剩 n 一 m 个 位 置 来 容纳 其 余 k 个 组 。 归 纳 假设 适用 ， 并且 表 
明 最 后 一 组 的 每 种 位 置 选择 都 对 应 着 其 余 位 置 中 其 余 元 素 的 (n 一 m)!/ IT i,! 种 不 同 次 序 。 该 式 
与 (4.7) 式 相 比 ,只 是 将 (4.7) 式 中 n 的 位 置 检 换 成 了 nm ,因为 只 剩 n-m 项 有 得 放置 了 。 因 此 k+l1 











组 项 的 次 序 总 数 为 
je 
让 二 (4.8) 
如 果 将 (4 驹 中 的 | ”| 替换 成 等 从 的 mt -mm 就 得 到 
” n! (nn-m)! 





(4.9) 


(n—m)lm! [li! 
可 以 从 (4.8) 式 的 分 子 和 分 母 中 约 去 (n 一 m)! 。 此 外 ， 请 记 住 m 是 i,, ， 是 第 上 +1 组 中 的 成 员 的 数 
目 。 因 此 可 得 到 次 序数 为 


这 正 是 SC+1) 所 给 出 的 式 子 。 


+ 示例 4.14 

一 位 探险 家 带 了 两 个 星期 的 口粮 ， 其 中 包括 4 罐 金枪鱼、7 缸 午餐 肉 以 及 3 锡 黄 豆 铅 头 。 如 果 
他 每 天 打开 一 饶 饶 头 ， 那 么 他 消耗 这 些 口粮 的 次 序 共 有 多 少 种 ? 这 里 的 14 项 分 成 了 分 别 具 有 4、7 
和 3 个 相同 项 的 3 组 。 按 照 (4.7) 式 ， 其 中 n=14，k=3，ii =4 ,=7，i=3。 因 此 他 消耗 口粮 
的 次 序数 为 














14! 
4!X7!X3! 
先 从 分 母 中 的 7! 开 始 ， 可 以 约 去 分 子 14! 中 最 后 7 个 因数 。 因 此 就 得 到 
14x13x12xllxl10x9x8 
4x3x2xlx3x2xl 





继续 约 去 分 子 和 分 母 中 的 因数 ， 就 可 以 得 到 结果 为 120 120。 也 就 是 说 ,消耗 这 些 口 粮 的 方法 有 
逾 10 万 种 。 可 异 每 一 种 听 起 来 都 让 人 没什么 胃口 。 


习题 


(1) 计算 以 下 单词 的 字母 构 词 的 数量 : (a) error; (b) street; (co) allele; (d)Mississippi。 
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(2) 将 下 列 水 果 排 成 一 线 共 有 多 少 种 方法 ? 
(a) 3 个 苹果 、4 个 梨 和 5 根 香 礁 ; 
(b) 2 个 人 苹果、6 个 梨 、3 根 香 太 和 2 上 颗 李 子 。 

(3)* 将 白 王 、 黑 王 、2 个 白 骑士 和 1 个 黑车 摆 在 棋盘 上 ， 共 有 多 少 种 摆 法 ? 

(4) * 100 个 人 参与 到 一 场 彩 票 游 戏 中 。 其 中 一 人 可 赢得 千 元 大 奖 ， 还 有 5 人 可 以 得 到 5$0 美 元 储蓄 基金 
的 安慰 奖 。 那 么 总 共 可 能 有 多 少 种 不 同 的 获奖 结果 ? 

(5) 写 一 个 简单 的 公式 ， 用 来 计算 放置 ?对 两 两 相等 的 2 个 对 象 的 次 序数 。 


4.7 ”将 对 象 分 效 入 箱 


我 们 要 介绍 的 下 一 类 计数 问题 涉及 对 盛装 若干 对 象 之 容 需 的 选择 。 这 些 对 象 可 能 相同 ， 也 
可 能 不 同 ， 不 过 容 需 是 有 区 别 的 。 我 们 必须 计算 这 些 装 满 容 需 的 方法 数 。 
+ 示例 4.15 

有 凯 西 、 彼 得 和 苏 姗 3 个 孩子 ， 我 们 要 将 4 个 苹果 分 给 他 们 ， 而 不 把 苹果 切 开 。 那 么 共有 多 
少 种 分 配 苹 果 的 方式 ? 

这 里 的 方法 数 比 较 少 ， 因 此 可 以 直接 将 其 枚 举 出 来 。 凯 西 可 能 得 到 从 0 至 4 个 不 等 的 苹果 ， 
而 不 管 余下 儿 个 人 苹果， 分 给 彼得 和 苏 妖 的 方式 都 只 有 少数 几 种 。 如 果 设 (i, j,k) 表示 凯 西 得 到 i 
个 人 苹果、 彼得 得 到 /个 苹果 而 苏 姗 得 到 ki 个 蔷 果 的 情况 , 那么 图 4-12 就 展示 了 全 部 15 种 可 能 的 分 配 
方式 。 每 一 行 对 应 着 分 给 凯 西 的 苹果 数 。 








(0, 1, 3) (0, 2, 2) (0, 3, 1) (0，4，0) 
(1, 1, 2) (1, 2, 1) (1, 3, 0) 
(2, 1, 1) (2, 2, 0) 


(3, 1, 0) 





图 4-12 ”把 4 个 苹果 分 给 3 个 孩子 共有 15 种 方式 

为 将 相同 对 象 分 装 入 箱 计数 的 方法 有 个 诀窍。 假设 用 4 个 字母 来 表示 4 个 苹果 ， 并 用 两 个 * 
来 分 隔 属 于 不 同 孩 子 的 人 苹果。 两 个 * 之 间 的 A 的 数量 就 表示 彼得 分 到 的 苹果 数 ， 而 第 二 个 * 之 后 
的 A 的 数量 则 表示 属于 苏 刀 的 苹果 数 。 例 如 ，AA*A*A 表 示 ( 2,1,1 ) 的 分 配方 式 ， 其 中 凯 西 分 到 
2 个 苹果 ， 其 余 两 个 孩子 各 分 到 1 个 。 而 序列 AAA*A* 则 表示 (3,1,0 ) 的 分 配方 式 ， 其 中 凯 西 得 
到 3 个 ， 彼 得 得 到 1 个 ， 苏 姗 一 个 都 没有 。 

因此 ， 每 种 分 发 苹果 的 方式 都 与 由 4 个 A 和 2 个 * 组 成 的 唯一 字符 串 相 关 。 那 么 有 多 少 这 样 的 
字符 串 呢 ? 考虑 一 下 组 成 这 种 字符 串 的 6 个 位 置 。 其 中 任 选 4 个 位 置 用 来 存放 &A, 另外 两 个 位 置 用 
来 存放 * 。 正 如 我 们 在 4.5 节 中 了 解 到 的 ， 从 6 项 中 选择 4 项 共有 (4) 种 方法 。 因 为 4)=15 ， 所 以 
又 一 次 得 出 了 将 4 个 苹果 分 给 3 个 孩子 的 方法 共有 15 种 的 结论 。 
4.7.1 装 箱 问题 的 一 般 规 则 

我 们 可 以 按照 下 列 方式 将 示例 4.15 介 绍 的 问题 一 般 化 。 假 设 给 定 z 个 容 需 , 它们 对 应 示例 中 的 3 
个 孩子 。 同 时 假设 要 将 m 个 相同 的 对 象 随意 地 放 进 这 些 容 需 中 。 那么 有 多 少 种 分 装 和 信箱 的 方式 呢 ? 

这 里 可 以 再 次 考虑 A 和 * 组 成 的 字符 串 。&A 表 示 对 象 ， 而 * 表 示 容 需 间 的 边界 。 如 果 有 7 个 对 
象 ， 就 有 7 个 A， 而 如 果 有 7 个 容 需 ， 那 么 就 需要 六 -1 个 * 来 表示 分 隔 不 同 容 需 的 边界 。 因 此 ， 
字符 串 的 长 度 为 n+m-1。 
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n+m—l 


我 们 可 以 从 这 些 位 置 中 任 选 (个 存放 A， 乔 下 的 就是 存放 * 的 。 因 此 共有 | ja 和 
* 组 成 的 字符 上 串 ， 那 么 将 对 象 分 装 和 信箱 的 方式 也 有 这 么 多 种 。 在 示例 4.15 中 ， 有 n=4 且 m=3， 
所 以 就 可 以 得 到 共有 ”| -| 种 分 配方 式 的 结论 。 
+ 示例 4.16 

在 掷 仍 子 游戏 中 ,要 掷 出 3 个 仍 子 ， 其 中 每 个 山子 的 6 个 面 上 都 标记 了 从 1 到 6 这 6 个 数字 。 玩 
家 可 以 为 某 个 数字 财 上 1 美元 。 如 果 这 个 数字 不 出 现 , 钱 就 输 控 了 。 如 果 该 数字 出 现 一 次 或 多 次 ， 
那么 该 玩家 就 可 以 得 到 与 该 数字 出 现 次 数 等 额 的 美元 。 

我 们 可 能 想 要 为 “结果 ”计数 ， 不 过 一 开始 在 “结果 ”是 什么 的 问题 上 可 能 有 些 疑问 。 
如 果 将 仍 子 不 同 的 面 涂 上 不 同 颜色 以 方便 区 别 ， 就 可 将 其 视 为 42 节 中 那样 的 计数 问题 ， 其 中 4 
颗 般 子 中 的 每 “ 且 都 能 分 配 6 个 数字 中 的 一 个 。 我 们 知道 , 进行 这 样 的 分 配 共 有 6 = 216 种 方式 

不 过 ， 散 子 通常 是 没有 区 别 的 ， 这 些 数字 出 现 的 顺序 也 是 无 关 紧 要 的 ， 只 有 每 个 数字 出 现 
的 次 数 决定 了 哪个 玩家 会 赢 钱 ， 会 赢 多 少 钱 。 例 如 ， 折 肯 子 的 结果 可 能 是 有 两 颗 是 1， 而 第 三 颗 
是 6。 而 6 可 能 出 现在 第 ] 颗 、 第 2 颗 或 第 3 颗 明 子 上 ， 不 过 出 现在 哪 颗 明子 上 都 是 没关系 的 。 

因此 ,可 以 把 这 一 问题 视 为 将 相同 对 象 分 装 入 箱 的 问题 。“ 容 器 ”就 是 1 到 6 这 几 个 数字 ,而 
“对 象 ”就 是 3 个 鹏 子 。 一 颗 仍 子 会 被 “分 装 ” 到 对 应 该 仍 子 掷 出 数字 的 那个 容器 。 因 此 ， 据 骨 


子 游戏 总 共有 。 | 站 _ 56 种 不 同 的 结果 。 

















4.7.2 ”分 装 有 区 别 的 对 象 


我 们 可 以 将 之 前 的 公式 扩展 一 下 ， 以 便 处 理 将 可 分 为 砚 的 mx 个 对 象 装 人 mm 个 容 吉 的 问题 。 
同一 类 中 的 对 象 是 没有 区 别 的 ， 但 不 同类 的 对 象 是 不 同 的 。 这 里 用 符号 a 表示 第 i 类 中 的 成 员 。 
此 可 以 构成 由 下 列 对 象 组 成 的 字符 串 。 

(1) 对 每 个 类 ;， 与 类 中 所 含 成 员 数量 等 量 的 ar; 

(2) 用 来 表示 mm 个 容 需 间 的 边界 的 站 -1 个 *。 

因此 这 些 字 符 串 的 长 度 是 2+ 灵 -1, 请 注意 , 这 些 * 构 成 了 第 三 1 个 类 , 而 该 类 包含 了 m 个 成 员 。 

我 们 在 4.6 节 中 已 经 了 解 过 如 何 为 这 样 的 字符 串 计 数 。 字 符 串 的 个 数 为 

(nt+m—1)! 


全 
COz-DI 2 














其 中 i 表示 的 是 第 j 类 中 的 成 员 数 。 


+ 示例 4.17 
假设 有 三 个 人 苹果、 两 个 梨 和 一 根 香 态 要 分 给 凯 西 、 彼 得 和 苏 如 。 那 么 “容器 ”的 数量 ， 也 就 是 
孩子 的 数量 m=3 。 共 有 k=3 组, 分别 有 i =3 、i,=2 和 i,=1 个 成 员 。 因 为 总 共有 6 个 对 象 ， 所 以 
n=6， 因 此 该 问题 中 的 字符 串 的 长 度 为 n+m 一 1 = 8 。 这 些 字符 串 由 3 个 表示 苹果 的 A、 两 个 表示 梨 的 
P、 一 个 表示 香蕉 的 B， 以 及 两 个 表示 边界 的 * 组 成 。 因 此 ， 由 分 发 方法 数 的 计算 公式 可 得 到 共有 
(n+m—1)! 81 


i A ee A =] 
(m—DIilbli! 2!13!12!1! 
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种 将 这 些 水 果 分 发 给 山西 、 彼 得 和 苏 姗 的 方式 。 





计数 问题 的 对 比 


在 本 节 及 之 前 的 4.1 到 4.5 节 中 ,我 们 已 经 考虑 了 6 种 不 同 的 计数 问题 。 每 种 问题 都 可 视 作 为 
特定 的 位 置 分 配对 象 。 例 如 ，4.2 节 介绍 的 分 配 问 题 可 以 视 为 给 定 了 1 个 位 置 (对 应 房屋 )， 以 
及 不 限量 的 具有 kK 个 不 同类 型 ( 对 应 颜色 ) 之 一 的 对 象 。 我 们 可 以 顺 着 3 个 方向 为 这 些 问 题 分 类 。 

(1) 它们 是 否 会 放置 所 有 给 定 的 对 象 ? 

(2) 分 配对 象 的 次 序 是 否 重要 ? 

(3) 所 有 对 和 象 都 是 不 同 的 ， 还 是 说 某 些 对 象 没 有 区 别 ? 

下 表 表 示 了 之 前 各 节 提 到 的 问题 之 间 的 区 别 。 


节 典型 问题 是 否 必须 使 用 所 有 对 象 次 序 是 否 重要 是 否 有 相同 的 对 象 
4.2 粉刷 房屋 否 是 否 
4.3 排序 是 是 否 
4.4 赛马 比赛 否 是 否 
4.5 扑克 牌 型 否 否 是 
4.6 构 词 是 是 是 
4.7 给 孩子 分 苹果 是 否 是 


4.2 节 和 4.4 节 中 的 问题 在 上 表 中 体现 不 出 什么 区 别 。 它 们 的 区 别 在 于 是 否 放 回 ， 正 如 之 前 
4.4.1 节 附注 栏 “有 放 回 选择 和 无 放 回 选择 ”中 讨论 的 那样 。 也 就 是 说 ， 在 4.2 节 中 ， 每 种 “ 闫 
色 ” 都 是 不 限量 供应 的 ， 可 以 多 次 选择 同一 颜色 。 而 在 4.4 节 中 ， 一 匹 被 选 定 的 “赛马 ”不 能 
在 同一 系列 的 选择 中 再 被 选中 了 。 





4.7.3 “习题 

(1) 进行 下 列 分 配 任务 分 别 有 多 少 种 方法 ? 
(a) 6 个 苹果 分 给 4 个 孩子 ; 
(b) 4 个 苹果 分 给 6 个 孩子 ; 
(c) 6 个 苹果 和 3 个 梨 分 给 5 个 孩子 ; 
(d) 2 个 苹果 、5 个 梨 和 6 根 香蕉 分 给 3 个 孩子 。 

(2) 下 列 情况 分 别 有 多 少 种 结果 ? 
(a) 掷 4 颗 无 区 别 的 货 子 ; 
(b) 掷 5 颗 无 区 别 的 般 子 。 

(G)* 将 7 个 苹果 分 给 3 个 孩子 ， 并 保证 每 个 孩子 至 少 得 到 一 个 苹果 ， 共 有 多 少 种 分 发 方法 ? 

(4) * 假设 从 国际 象棋 棋盘 的 左下 角 开 始 向 右上 角 移 动 ， 每 次 向 上 或 向 右 移 动 一 格 ， 完 成 这 一 移动 的 
方式 共有 多 少 种 ? 

(53)* 将 习题 (4) 一 般 化 。 如 果 有 一 个 由 z 个 方 格 乘 上 7 个 方 格 组 成 的 矩形 ， 并 可 以 从 一 个 方 格 向 上 或 向 
右 移动 到 另 一 个 方 格 ， 那 么 从 左下 角 移 动 到 右上 角 总 共有 多 少 种 方法 ? 


4.8 计数 规则 的 组 合 


组 合 这 一 主题 能 带 来 无 数 的 挑战 ， 而 且 很 少 像 本 章 之 前 所 讨论 的 那样 简单 。 不 过 ， 我 们 目 
前 所 了 解 到 的 规则 都 是 最 基础 ， 它 们 都 很 有 价值 ， 能 以 各 种 方式 结合 起 来 为 更 加 复杂 的 结构 计 
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数 。 在 本 节 中 ， 我 们 将 了 解 到 3 种 实用 的 计数 “诀窍 ”。 

(1) 将 计数 表示 为 一 系列 选择 ; 

(2) 将 计数 表示 为 计数 的 差 ; 

(3) 将 计数 表示 为 子 情况 的 计数 之 和 。 
4.8.1 将 计数 分 解 为 一 系列 选择 

在 为 某 类 分 配 计数 时 ， 有 一 种 实用 的 方法 可 以 采用 ， 就 是 将 这 些 待 计数 的 事物 描述 为 一 系 
列 的 选择 ， 其 中 每 次 选择 都 会 细 化 该 类 中 某 个 特定 成 员 的 描述 。 在 本 节 中 ， 我 们 会 给 出 一 系列 
表示 某 些 可 能 性 的 示例 。 
+ 示例 4.18 

考虑 一 下 扑克 牌 型 中 “对 子 ”( one-pair ) 的 数量 。 该 牌 型 由 一 对 具有 某 个 秩 * 的 牌 , 加 上 3 张 具 
有 不 同 秩 ( 而 且 与 之 前 一 对 的 秩 不 同 ) 的 牌 组 成 。 我 们 可 以 通过 如 下 步骤 描述 所 有 的 “对 子 ” 牌 型 。 

(1) 为 成 对 的 牌 选 择 秩 ; 

(2) 从 其 余 12 种 秩 中 为 其 余 3 张 牌 选择 3 个 不 同 的 秩 ; 

(3) 为 成 对 的 牌 选 择 花色 ; 

(4) 为 其 他 3 张 牌 选择 花色 。 

如 果 将 这 些 数字 相 乘 ， 将 得 到 “对 子 ” 牌 型 的 数量 。 请 注意 ， 牌 型 中 各 张 牌 出 现 的 顺序 是 
无 关 紧 要 的 ， 正 如 之 前 在 示例 4.8 中 讨论 过 的 ， 而 且 我 们 从 未 尝试 过 指定 次 序 。 

现在 , 要 依次 接受 这 些 因 素 。 为 成 对 的 那 两 张 牌 选择 秩 的 方式 有 13 种 。 不 管 选择 了 哪个 秩 ， 
都 会 余下 12 种 。 接 下 来 必须 从 这 些 秩 中 选择 3 个 组 成 剩 下 的 牌 型 。 就 像 4.$ 节 中 讨论 过 的 ， 这 也 


是 一 种 次 序 不 重要 的 选择 ， 执 行 这 种 所 择 的 方式 共有 | | = 220 各。 
现在 必须 为 这 对 牌 选择 花色 。 共有 4 种 花色 ,而 且 我 们 必须 从 中 选择 两 种 。 这 次 又 是 无 序 的 
光 择 ,可 以 有 |[ ?| -6 各 方式。 最后， 为 利 下 的 3 张 选 择 花 色 。 每 张 用 有 4 种 兹 色 可 选 ， 所 以 


又 是 4.2 节 中 那样 的 分 配 问题 ， 进 行 分 配 的 方式 共有 4 = 64 种 。 
因此 , “对 子 ” 牌 型 的 总 数量 为 13x220x6x64 =1098 240 种 ， 这 一 数字 在 2 598 960 种 扑克 
牌 型 中 占 了 40% 以 上 。 


4.8.2 ”用 计数 的 差 来 计算 计数 
另 一 种 实用 技巧 是 , 将 要 计数 的 内 容 表示 为 某 个 更 具 一 般 性 的 排列 类 C 与 C 中 不 满足 计数 条 
件 的 那些 事物 之 间 的 差 。 


+ 示例 4.19 

还 有 很 多 种 扑克 牌 型 ( 两 对 、 三 条 、 铁 支 和 菁 芦 ) 可 以 按照 类 似 示 例 4.18 的 方法 计数 。 不 
过 ， 还 有 一 些 其 他 牌 型 需要 不 同 的 方法 来 计数 。 

先 来 考虑 一 下 同花顺 的 情况 ， 也 就 是 $ 张 花色 相同 ( 同 花 ) 而 且 秩 连续 ( 顺 子 ) 的 牌 型 。 首 
先 ， 每 个 顺 子 都 是 从 A 到 10 这 10 个 秩 之 一 开始 的 。 也 就 是 说 ， 顺 子 可 能 是 A-2-3-4-5，2-3-4-5-6， 
3-4-5-6-7， 等 等 ， 最 大 的 可 能 是 10-J-Q-K-A。 一 旦 秩 确定 ， 就 只 需要 指定 一 种 花色 来 指定 该 同 




















Q@ 13 个 秩 分 别 为 A、K、Q、J， 以 及 2 到 10。 
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花 顺 了 。 因 此 ， 为 同花顺 计数 包含 以 下 两 步 : 

(1) 选择 顺 子 的 最 低 秩 ( 10 种 选择 ); 

(2) 选择 花色 ( 4 种 选择 )。 
因此 ， 总 共有 10x4 = 40 种 同花顺 牌 型 。 

现在 来 为 顺 子 牌 型 计数 ， 也 就 是 那些 秩 连 续 但 又 不 是 同花顺 的 牌 型 。 先 要 计算 所 有 具有 连 
续 秩 的 牌 型 的 数量 ， 不 考虑 它们 的 花色 是 否 相 同 ， 然 后 再 减 去 40 种 同花顺 牌 型 。 要 为 秩 连 续 的 
牌 型 计数 ， 可 以 按 以 下 两 步 进 行 : 

(1) 选择 最 低 的 秩 ( 10 种 选择 ); 

(2) 为 每 个 秩 指定 一 种 花色 ( 如 4.2 节 介绍 的 ， 有 4 =1024 种 选择 )。 

因此 ， 顺 子 和 同花顺 牌 型 的 总 数 是 10x1 024 =10 240 种 。 减 去 40 种 同花顺 牌 型 后 ， 就 得 出 
顺 子 牌 型 共有 10 240-40 =10 200 种 。 

接 下 来 ,考虑 一 下 同 花 牌 型 的 数目 。 这 里 还 是 要 先 将 同花顺 牌 型 考虑 在 内 ， 然 后 再 减 去 那 
40 种 同花顺 牌 型。 可 以 通过 如 下 方式 定义 同 花 牌 型 。 

(1) 选择 花色 〈 4 种 选择 ); 


2) 从 13 个 秩 中 任 选 5? 个， 如 4.5 节 介绍 的 ， 共 有 四 _1 287 种 方式 。 
于 是 可 以 得 出 同 花 牌 型 共有 4x1 287-40=S108 种 。. 
4.8.3 ”将 计数 表示 为 子 情况 的 和 


在 面 对 一 些 很 难 直接 解决 的 问题 时 ， 就 要 用 到 第 三 种 “ 诀 客 ” 了 。 可 以 把 为 某 个 类 C 计 数 
的 问题 分 解 成 两 个 或 多 个 单独 的 问题 ， 而 类 C 中 的 各 个 成 员 刚 好 都 能 被 子 问题 之 一 涵盖 。 


+ 示例 4.20 
假设 要 抛 10 次 硬币 ,那么 8 个 或 8 个 以 上 硬币 人 头面 朝 上 的 序列 有 多 少 种 ”如 果 想 知道 有 多 少 


序列 刚好 有 8 个 硬币 人 头面 则 上 ， 可 以 用 4.5 节 介绍 的 方法 来 解决 。 共 有 四 -45 种 这 样 的 序列 。 


要 解决 为 8 个 或 8 个 以 上 硬币 人 头面 朝 上 的 序列 计数 的 问题 , 可 以 将 其 分 解 为 3 个 子 问题 , 即 分别 
为 刚好 有 8 个 硬币 人 头面 朝 上 、 刚 好 有 9 个 硬币 人 头面 朝 上 以 及 10 个 硬币 全 部 人 头面 朝 上 的 情况 计数 。 


我 们 已 经 解决 了 第 一 个 问题 。 而 9 个 硬币 人 头面 朝 上 的 序列 共有 四 =10 种 ，10 个 硬币 全 是 人 头面 








朝 上 的 序列 共有 四 =1 种 。 因 此 ， 有 8 个 或 8 个 以 上 硬币 人 头面 朝 上 的 序列 共有 45+10+1= 56 种 。 


+ 示例 4.21 

再 来 考虑 一 下 示例 4.16 中 解决 的 为 拨 骨 子 游戏 的 结果 计数 的 问题 。 男 一 种 方法 就 是 根据 所 
出 现 的 不 同 数字 是 3 个 、2 个 或 1 个 ， 将 该 问题 分 成 3 个 子 问题 。 

(a) 可 以 用 4.5 节 介绍 的 技巧 计算 3 个 数字 名 不 同 的 结果 的 数量 。 也 就 是 从 一 颗 骨 子 6 个 可 能 


的 数字 中 选 出 3 个 ， 总 共有 目 -20 种 不 同 的 方法 。 


(b) 接着 ,要 计算 两 颗 仍 子 是 一 个 数 ， 而 另 一 颗 是 必 一 个 数 的 情况 有 多 少 种 。 出 现 两 次 的 数 
字 有 6 种 选择 ， 每 种 情况 下 对 应 的 出 现 一 次 的 数字 有 5 种 选择 。 所 以 两 颗 货 子 是 一 个 数 而 另 一 颗 
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是 男 一 个 数 的 结果 共有 6x5 =30 种 。 
(c) 3 颗 般 子 数字 全 相同 的 情况 共有 6 种 。 
因此 ， 可 能 的 结果 共有 20+30+6=56 种 ， 这 与 示例 4.16 中 得 到 的 结论 是 一 样 的 。 


4.8.4 习题 


(1)* 为 以 下 扑克 牌 型 计数 : 
(a) 两 对 ; 
(b) 三 条 ; 
(c) 戎 芦 〈 三 条 加 一 对 ) ; 
(d) 铁 支 ( 四 条 ) 。 
请 注意 ,在 为 某 种 牌 型 计数 时 不 要 将 那些 更 佳 的 牌 型 计算 在 内 了 。 例 如 ， 在 情况 (a) 中 ， 要 确定 两 
对 是 不 同 的 ， 不 然 就 是 拿 到 了 铁 支 牌 型 ， 而 且 要 保证 第 5 张 牌 和 这 两 对 的 秩 不 一 样 ， 否 则 就 是 拿 
到 了 戎 疡 牌 型 。 








(a) 在 一 探 $2 张 扑克 牌 中 ， 有 多 少 种 不 同 的 黑 杰 克 ? 

(b) 在 黑 杰 克 游 戏 中 ,， 有 一 张 牌 是 暗 牌 ， 而 另 一 张 是 明 牌 。 因 此 ， 两 张 牌 的 次 序 是 有 影响 的 。 在 这 
种 情况 下 ， 有 多 少 种 不 同 的 黑 杰 克 ? 

(c) 在 皮 诺 奇 勒 牌 游戏 中 ， 只 使 用 秩 为 9、10、J、Q、K 和 A 的 牌 各 8 张 ( 每 种 花色 各 有 两 张 同 秩 的 
牌 ) ， 而 不 使 用 其 他 扑克 牌 。 假 设 次 序 无 关 紧 要 ， 共 有 多 少 种 黑 杰 克 ? 

(3) “什么 都 不 是 ”( 即 不 是 对 子 或 更 好 ) 的 牌 型 共有 多 少 种 ? 大 家 可 能 要 利用 示例 4.18 和 示例 4.19 
的 结果 以 及 习题 (1) 的 解答 。 

(4) 如 果 依 次 抛 12 枚 硬币 ， 那 么 下 列 情况 各 有 多 少 种 ? 

(a) 至 少 有 9 枚 硬币 人 头面 朝 上 ; 
(b) 至 多 有 4 枚 硬币 人 头面 彰 上 ; 
(c) 有 5 到 7 枚 硬币 人 头面 朝 上 ; 
(d) 不 到 2 枚 或 多 于 10 枚 硬币 人 头面 朝 上 。 

(5) * 至 少 有 一 个 数字 为 1 的 掷 货 子 结果 共有 多 少 种 ? 

(6) * 使 用 单词 1ittle 的 字母 构 词 ， 其 中 两 个 t 不 相 邻 的 情况 共有 多 少 种 ? 

(7) ** 桥牌 牌 型 由 $2 张 扑克 牌 中 的 13 张 构成 ,我 们 通常 会 通过 “分 布 ” 为 牌 型 分 类 ， 也 就 是 说 ， 会 按 
照 花色 为 手 牌 分 组 例如, 牌 型 4-3-3-3 的 分 布 表 示 有 4 张 牌 是 某 种 花色 ,而 另外 3 种 花色 的 牌 各 有 3 
张 。 牌 型 5-4-3-1 的 分 布 表 示 各 花色 的 牌 分 别 有 5 张 、4 张 、3 张 和 1 张 。 为 具有 如 下 分 布 的 牌 型 计数 : 
(a)4-3-3-3; (b)5-4-3-1; (c)4-4-3-2; (d)9-2-2-0。 


4.9 ”概率 论 简介 


概率 论 在 计算 机 科学 领域 具有 很 多 用 途 ， 其 中 一 种 重要 应 用 就 是 估算 平均 输入 或 典型 输入 
情况 下 的 程序 运行 时 间 。 这 种 估算 对 那些 最 坏 情况 运行 时 间 远 大 于 平均 运行 时 间 的 算法 来 说 非 
常 重要 。 我 们 很 快 就 会 看 到 这 种 估算 的 示例 。 

概率 的 另 一 种 用 途 是 在 具有 不 确定 性 的 情况 下 设计 制定 决策 的 算法 。 例 如 , 可 以 使 用 概率 论 ， 
设计 根据 可 用 信息 制定 最 佳 医疗 诊断 的 算法 ， 或 设计 在 未 来 预期 需求 的 基础 上 分 配 资源 的 算法 。 


4.9.1 概率 空间 
概率 空间 是 指点 的 有 限 集 , 这 些 点 分 别 表示 某 一 实验 的 某 种 可 能 结果 。 每 个 点 x 都 与 某 个 称 
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作 x 的 概率 的 正 实数 相关 联 ， 而 所 有 点 对 应 概率 的 和 为 1。 还 有 无 限 多 个 点 的 概率 空间 这 样 的 说 
法 ， 不 过 这 种 概念 在 计算 机 科学 领域 鲜 有 应 用 ， 所 以 这 里 不 需要 考虑 这 些 

通常 ， 概 率 空 间 中 的 点 都 是 等 可 能 的 。 除 非特 别 声明 ， 否则 可 以 假设 概率 空 s 间 中 硅 干 点 表 
示 的 概率 都 是 相等 的 。 因 此 ， 如 果 概 率 空 间 中 有 n 个 点 ， 则 每 个 点 的 概率 都 是 1/n 。 


+ 示例 4.22 
图 4-13 所 示 为 具有 6 个 点 的 概率 空间 。 这 些 点 分 别 被 标记 为 从 1 到 6 这 6 个 数字 中 的 一 个 ， 而 
且 可 将 该 空间 视 为 表示 撕 一 次 山 子 这 项 字 验 ”的 结果 。 也 就 是 说 , 租 子 6 个 面 中 某 个 面 上 的 数 
字 会 出 现在 最 上 方 ， 而 每 个 数字 出 现 的 概率 都 是 均等 的 ， 即 都 是 1/6 。 
1 他 3 











4 5 6 
图 4-13 ”具有 6 个 点 的 概率 空间 
ee et ie 
是 E 中 各 点 概率 之 和 。 如 果 这 些 点 都 是 等 可 能 的 ， 就 可 以 用 E 中 点 的 数 日 除 以 整个 概率 空间 中 点 
的 数 上 日 来 计算 E 的 概率 。 


4.9.2 ”概率 的 计算 

通常 情况 下 ， 计 算 某 个 事件 的 概率 会 涉及 组 合 。 我 们 必须 计算 事件 中 点 的 数量 ， 以 及 整 
概率 空间 中 点 的 数量 。 当 点 是 等 可 能 时 ， 这 两 个 计数 的 比 就 是 该 事件 的 概率 。 人 
系列 示例 ， 展 示 按 这 种 方式 计算 概率 的 过 程 。 





无 限 的 概率 空间 
在 某 些 情况 下 ， 可 以 想象 一 个 具有 无 数 个 点 的 概率 空间 ， 其 中 任何 给 定 的 点 的 概率 都 可 能 
是 无 穷 的 ， 从 而 只 能 将 有 限 的 概率 与 某 些 点 的 集合 关联 起 来 。 举 个 简单 的 例子 ， 下 图 中 的 正方 
形 表 示 某 个 概率 空间 ， 而 该 概率 空间 中 的 点 是 该 正方 形 所 在 平面 上 的 所 有 点 。 


事件 EE 


可 以 假设 正方 形 中 任何 点 被 选中 的 可 能 性 都 是 相等 的 ,并 将 这 种 “实验 ” 视 作 往 该 正方 形 
中 投掷 飞镖 ， 飞 镖 飞 到 正方 形 上 任何 位 置 的 可 能 性 都 是 相同 的 ， 但 肯定 不 会 飞 到 正方 形 之 外 。 
虽然 任何 一 点 被 击 中 的 概率 都 是 无 穷 的 , 但 是 该 正方 形 中 某 个 区 域 的 概率 等 于 该 区 域 的 面积 与 
整个 正方 形 的 面积 之 比 。 因 此 ， 我 们 可 以 计算 某 些 事件 的 概率 。 

例如 ， 上 图 的 概率 空间 中 含有 一 个 椭圆 形 组 成 的 事件 已 。 假 设 该 椭圆 区 域 的 面积 是 整个 正 
方形 面积 的 29%， 那 么 PROB (5) 就 是 0.29。 也 就 是 说 ， 如 果 随 机 地 向 该 正方 形 投 出 飞 锤 ， 那 么 
29% 的 情况 下 飞镖 会 落 在 这 个 椭圆 中 。 
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+ 示例 4.23 

图 4-14 展 示 了 表示 掷 两 颗 货 子 的 概率 空间 。 也 就 是 说 ,进行 的 实验 是 按 顺 序 抛 出 两 颗 般 子 ， 
并 观察 它们 朝 上 那 面 的 数字 。 假 设 搓 仍 子 的 过 程 是 公平 的 ， 就 有 36 个 等 可 能 的 点 ， 或 者 说 是 实 
验 结果 ， 所 以 每 个 点 的 概率 都 是 1/36 。 每 个 点 对 应 着 每 颗 骨 子 从 6 个 值 中 任 选 其 一 的 分 配 。 例 
如 ,〈2,3 ) 就 表示 第 一 颗 人 般 子 为 2 点 ， 而 第 二 颗 货 子 为 3 点 的 情况 。 而 〈3,2 ) 则 表示 第 一 颗 货 子 
是 3， 第 二 颗 是 2 的 情况 。 

被 圈 出 来 的 区 域 表 示 “ 吃 当 ” 的 事件 ,也 就 是 两 颗 骨 子 的 总 点 数 为 7 或 11 的 情况 。 这 个 事件 











共 含有 8 个 点 ， 其 中 6 个 是 总 点 数 为 7 的 情况 ， 而 有 两 个 是 总 点 数 为 11 的 情况 。 投 出 “ 吃 数 ”情况 
的 概率 就 是 8/36， 约 为 22%。 


(1, 1) (1,2) (1,3) (1,4) ao 





图 4-14 ” 撕 两 颗 角 子 的 概率 空间 中 的 “ 吃 浆 ”事件 


+ 示例 4.24 

再 来 计算 一 下 扑克 牌 出 现 对 子 牌 型 的 概率 。 我 们 在 示例 4.8 中 已 了 解 到 总 共有 2598 960 种 不 
同 的 扑克 牌 型 。 考 虑 该 公平 处 理 扑 克 牌 型 的 实验 ， 也 就 是 说 ， 所 有 牌 型 出 现 的 可 能 性 都 相等 。 
因此 ， 该 实验 的 概率 空间 总 共有 2 598 960 个 点 。 我 们 还 从 示例 4.18 中 得 知 ， 这 些 表示 牌 型 的 点 
中 有 1 098 240 个 被 分 类 为 对 子 牌 型 。 假 设 所 有 牌 型 被 处 理 的 可 能 都 是 均等 的 ， 那 么 “对 子 ” 事 
件 的 概率 就 是 1 098 240/2 598 960， 大 约 是 42%。 
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+ 示例 4.25 

在 基诺 游戏 中 , 会 随机 从 1 到 80 这 些 数字 中 选 出 20 个 。 而且 选 取 这 些 数字 之 前 , 玩家 可 以 猜 
测 一 些 数 字 。 这 里 要 专门 讲 讲 这 个 玩家 要 猜测 5 个 数字 的 “5 点 游戏 ”"。 所 猿 数 字 与 选中 的 20 个 数 
字 中 有 3 个 、4 个 或 5 个 吻合 的 话 ， 玩 家 就 中 奖 了 ， 而 且 猜 中 的 数字 越 多 ， 得 到 的 奖金 越 丰 厚 。 我 
们 要 计算 的 是 玩家 在 该 游戏 中 正好 猜 中 3 个 数字 的 概率 。 正 好 猜 中 4 个 或 5 个 数字 的 概率 的 计算 将 
留 作 本 节 的 习题 。 

首先 , 合适 的 概率 空间 包含 了 表示 从 1 到 80 中 任 选 20 个 数字 所 有 可 能 情况 的 点 。 这样 的 选择 


总 共有 
801 80! 
20) 20160! 


种 ， 这 个 数字 奇 大 无 比 ， 好 在 不 需要 把 它 写 出 来 。 























结果 何 时 是 随机 的 ? 


在 示例 中 已 经 假设 过 某 些 实验 具有 “随机 的 ”结果 ， 也 就 是 说 ， 所 有 可 能 出 现 的 结果 的 可 
能 性 都 是 相等 的 。 在 一 些 情况 下 , 这 种 假设 的 合理 性 源 自 物理 学 。 例 如 , 在 投 搓 公 平 ( 未 加 重 ) 
的 骨 子 时 , 我 们 假设 在 物理 上 不 可 能 控制 骨 子 的 菜 个 面 比 其 他 面 更 可 能 朝 上 。 这 在 实践 中 是 种 
有 效 的 假设 。 同样, 我们 可 以 假设 公平 洗 牌 的 牌 堆 不 会 影响 结果 ， 而且 任何 一 张 牌 出 现在 牌 堆 
中 任意 位 置 的 可 能 性 都 是 相同 的 。 

在 其 他 情况 下 ,我 们 发 现 一 些 貌 似 随 机 的 事物 实际 上 根本 不 随机 ， 只 不 过 是 某 个 过 程 原则 
上 可 预知 但 在 实践 中 不 可 预知 的 结果 。 例 如 ,基诺 游戏 中 选 出 的 数字 可 能 是 由 计算 机 执行 某 个 
特殊 算法 生成 的 ， 而 如 果 没 法 接触 到 计算 机 使 用 的 这 些 秘密 信息 ， 就 不 可 能 预测 结果 。 

计算 机 生成 的 “随机 ”序列 都 是 某 种 被 称 为 随机 数 生成 器 的 特殊 算法 的 结果 。 设 计 这 样 的 
算法 需要 一 些 专门 的 数学 知识 ， 而 这 些 知识 超出 了 本 书 的 范畴 。 不 过 ， 我 们 会 介绍 一 种 实践 中 
相当 好 用 的 随机 数 生成 器 一 一 线性 同 余生 成 器 。 

指定 常数 4 宇 2，Db 宇 1 ，X 宇 0 ， 而且 amodmmax(a,b,Xx6)， 便 可 以 通过 使 用 公式 

X = (ax, +b)modm 

生成 一 列 数 字 x0，X1，X2…。 如 果 选 择 的 aq、b、m 和 xo 很 合适 ， 那 么 得 到 的 数字 序列 就 会 显得 相 
当 随 机 ， 即 便 它 们 是 通过 特定 算法 由 “种 子 ”xo 计 算得 出 的 。 

随机 数 生 成 器 生成 的 序列 有 很 多 用 途 。 例 如 ,可 以 根据 上 述 序列 选取 基诺 游戏 中 的 开奖 号 
码 ， 用 上 述 序列 中 的 每 个 数 除 以 80， 取 余数 ， 并 加 上 1， 得 到 1 到 80 间 的 某 个 “随机 ” 数 。 不 断 
这 样 处 理 ， 除 去 重复 的 数字 ， 直 到 选 出 20 个 数字 。 只 要 没 人 知道 生成 算法 和 种 子 ， 这 一 游戏 就 
可 视 为 是 公平 的 。 





现在 要 计数 的 情况 是 从 80 个 数字 中 选 出 20 个 ， 其 中 含有 玩家 所 选择 5 个 数字 中 的 3 个 ， 以 及 
玩家 没有 选择 的 75 个 数字 中 的 17 个 。 从 5 个 数字 中 选 出 3 个 共有 (5) =10 种 方式 ， 而 从 剩 下 的 75 
个 数字 中 洁 取 17 个 的 方式 共有 | [7 |- Le 

17 17158! 
因此 ， 玩 家 在 5 个 数字 中 猜 中 3 个 的 结果 数 与 总 选择 数 的 比 就 是 
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| 
0 .73! 
17!58! 
80! 
20!60! 











如 果 将 上 下 都 乘 上 一 ， 上 式 就 成 了 


oe 
17!58!/\ 80! 
可 以 看 到 分 子 和 分 母 中 的 阶乘 项 很 接近 , 几乎 可 以 约 去 。 例 如 , 分 子 中 的 75! 和 分 母 中 的 80! 
就 可 以 用 分 母 中 80 到 76 这 5 个 数 的 乘积 代替 ， 所 以 可 以 简化 为 
10x60x59x20x19x18 
80x79x78x77x76 
这 样 就 可 以 对 可 控 数字 加 以 计算 了 ,结果 是 0.084。 也 就 是 说 ,玩家 在 5 个 数字 中 猿 中 3 个 的 概率 
大 约 为 8.4%。 


4.9.3 ”基本 关系 
本 节 要 审视 概率 的 一 些 重要 属性 。 首 先 ， 如 果 p 是 任 一 事件 的 概率 ， 那 么 


0 pl 
也 就 是 说 , 任何 事件 都 是 由 0 个 或 更 多 个 点 组 成 ,所 以 它 的 概率 不 可 能 为 负 值 。 而且, 没有 任何 
事件 会 由 比 整个 概率 空间 还 多 的 点 构成 ， 所 以 它 的 概率 不 会 超过 1。 
其 次 ， 设 EF 是 某 个 概率 空间 P 中 的 事件 。 那 么 事件 E 的 互补 事件 E 就 是 P 中 不 属于 事件 E 的 点 
的 集合 。 不 难看 出 

















PROB(E) + PROB(E)= 1 
或 者 换 名 话说，PROB(E) =1-PROB(E) 。 原 因 在 于 ，P 中 的 每 个 点 ， 要 么 在 5 中， 要 么 在 已 中 ， 
不 可 能 同时 在 二 者 之 中 。 


4.9.4 习题 


(1) 使 用 图 4-14 中 展示 的 搓 两 颗 公平 仍 子 的 概率 空间 ， 给 出 以 下 事件 的 概率 。 
(a) 掷 出 的 点 数 为 6 ( 即 两 颗 仍 子 点 数 之 和 是 6 ) ; 
(b) 掷 出 的 点 数 为 10; 
(c) 掷 出 的 点 数 为 奇数 ; 
(d) 掷 出 的 点 数 在 5 到 9 之 间 。 
(2)* 计算 以 下 事件 的 概率 。 概 率 空间 是 从 普通 的 $2 张 扑克 牌 堆 中 按 次 序 取 两 张 牌 的 所 有 情况 。 
(a) 至 少 有 一 张 牌 是 A; 
(b) 两 张 牌 的 秩 相 同 ; 
(c) 两 张 牌 花色 相同 ; 
(d) 两 张 牌 的 秩 和 花色 都 相同 ; 
(e) 两 张 牌 要 么 秩 相 同 要 么 花色 相同 ; 
(f) 第 一 张 牌 的 秩 高 于 第 二 张 牌 的 秩 。 
(3) * 将 飞镖 掷 向 墙 上 一 英尺 见方 的 区 域 ， 击 中 该 方形 区 域 中 任何 一 点 的 可 能 性 都 是 相同 的 。 那 么 在 
投掷 飞镖 时 
(a) 离 中 心 3 英寸 以 内 的 概率 是 多 少 ? 
(b) 离 边 缘 3 英 寸 以 内 的 概率 是 多 少 ? 
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请 注意 ， 在 该 习题 中 ， 概 率 空间 是 一 个 一 英尺 见方 的 无 限 区 域 ， 其 中 所 有 点 都 是 等 可 能 性 的 。 
(4) 计算 玩家 在 基诺 5 点 游戏 中 猿 中 如 下 数字 的 概率 。 
(a) 猿 中 5 个 数字 中 的 4 个 ; 
(b) 猜 中 全 部 5 个 数字 。 
(5) 编写 C 语 言 程序 实现 线性 同 余 随 机 数 生成 器 。 绘 制 它 生成 的 前 100 个 数字 最 低 有 效 位 各 数字 出 现 频 
率 的 直方 图 。 该 直方 图 应 该 具有 什么 属性 ? 


4.10 ”条件 概率 


在 本 节 中 ， 我 们 将 指定 数 项 公式 和 策略 ， 用 来 考虑 铝 干事 件 概 率 之 间 的 关系 。 其 中 一 项 重 
要 的 结论 就 是 独立 实验 的 概念 。 在 独立 实验 中 ， 一 项 实验 的 结果 不 影响 其 他 实验 的 结果 。 我 们 
还 将 运用 一 些 技巧 来 计算 某 些 复杂 情形 下 的 概率 。 

这 些 结论 都 依赖 于 “条 件 概 率 ” 的 概念 。 不 严谨 地 说 ， 如 果 进 行 一 次 实验 ， 而 且 得 知事 件 
E 已 经 发 生 ， 那 么 表示 这 种 结果 的 点 也 有 可 能 出 现在 男 一 事件 fF 中。 图 4-15 就 展示 了 这 种 情况 。 
EZ 条 件 下 F 的 概率 就 是 E 发 生前 提 下 FF 也 发 生 的 概率 。 


Fr 


2 














EF 


图 4-15 EE 条 件 FF 的 概率 是 结果 在 4 中 的 概率 除 以 结果 在 4 或 在 8 中 的 概率 


正式 地 讲 , 如 果 E 和 Fr 是 某 个 概率 空间 中 的 两 个 事件 ,那么 E 条 件 下 FF 的 概率 , 记 作 PROB(FIE)， 
就 是 同时 出 现在 EZ 和 Fr 中 的 所 有 点 的 概率 之 和 除 以 出 现在 E 中 各 点 的 概率 之 和 。 在 图 4-15 中 ， 区 
域 4 表 示 那 些 同时 在 ZB 和 Ff 中 的 点 ，B 则 表示 在 E 中 而 不 在 F 中 的 点 。 如 果 所 有 点 都 是 等 可 能 的 ， 
那么 PROB(FIE) 就 是 4 中 点 的 数量 除 以 4 和 8B 中 点 的 数量 之 和 。 


+ 示例 4.26 

考虑 图 4-14 中 表示 掷 两 颗 货 子 的 概率 空间 。 设 事件 有 是 第 一 颗 般 子 点 数 为 1 的 6 个 点 ， 有 是 第 
二 颗 货 子 点 数 为 1 的 6 个 点 ， 情 形 如 图 4-16 所 示 。 既 在 有 中 又 在 F 中 的 点 只 有 一 个 ， 即 点 (1，1)。 
在 E 而 不 在 F 中 的 点 共有 5 个 。 因 此 ， 条 件 概率 PROB(EI 丰 为 116。 也 就 是 说 ， 在 确定 第 一 颗 山 子 为 
1 的 条 件 下 ， 第 二 颗 蜗 子 为 1 的 概率 是 1/6。 

大 家 可 能 会 注意 到 ,这 一 条 件 概 率 刚 好 等 于 F 本 身 的 概率 。 也 就 是 说 ,因为 F 占 有 整个 概率 空 
间 36 个 点 中 的 6 个 点 ， 所 以 PROB(m = 6/36= 116。 从 直观 上 讲 ， 第 二 颗 仍 子 掷 出 1 的 概率 ， 并 不 受 
第 一 颗 货 子 已 经 掷 出 1 这 一 事实 的 影响 。 我 们 很 快 就 将 定义 “独立 实验 ”( 比如 依次 掷 货 子 ) 的 概 
念 ， 其 中 一 次 实验 的 结果 不 会 对 其 他 实验 的 结果 产生 影响 。 在 这 样 的 情况 下 ， 如 果 有 和 是 表示 两 
次 实验 结果 的 事件 ， 就 可 以 预期 PROB(IE) = PROB(7)。 我 们 已 经 看 过 这 一 现象 的 一 个 例子 了 。 

















+ 示例 4.27 
假设 实验 是 从 有 52 张 扑克 的 牌 堆 中 按 次 序 取 两 张 牌 。 在 这 一 不 放 回 选择 ( 如 4.4 节 所 述 ) 实 


156 第 4 章 “” 组合 与 概率 





验 中 ， 点 的 数目 是 52 x 51 = 2652。 假 设 这 种 取 牌 是 公平 的 ， 所 以 每 个 点 的 可 能 性 都 是 相同 的 。 

设 事件 E 是 第 一 张 牌 为 A 的 情况 , F 是 第 二 张 牌 为 A 的 情况 。 那 么 5 中 的 点 共有 4 x 51=204 个 。 
也 就 是 说 ， 第 一 张 牌 是 4 张 A 中 的 某 一 张 ， 而 第 二 张 牌 可 以 是 除去 第 一 次 选 走 的 A 之 外 的 51 张 牌 
中 的 任意 一 张 。 因 此 ，PROB(B) = 20412652=1/113 。 这 一 结果 是 符合 大 家 的 直觉 的 。 所 有 13 种 
秩 都 是 等 可 能 性 的 ， 所 以 可 以 预期 第 一 张 牌 出 现 A 的 可 能 是 1/13。 

同样 ， 事件 F 中 也 有 4x51=204 个 点 。 可 以 为 第 二 张 牌 任 选 一 种 A， 并 在 其 余 51 张 牌 中 任 选 
其 一 作为 第 一 张 牌 。 第 一 张 牌 理论 上 讲 要 先 取 得 ， 而 这 一 事实 是 无 关 紧要 的 。 因 此 A 出 现在 第 
二 张 的 情况 共有 204 种 。 因 此 ， 与 一 样 ，PROB() = 1/13。 这 个 结果 还 是 满足 A 是 第 二 张 牌 的 可 
能 为 /13 这 一 直观 感受 。 

现在 来 计算 PROB(FIE)。 在 E 的 204 个 点 中 ,第 二 张 牌 也 为 A( 也 就 是 点 也 在 F 中 ) 的 情况 有 
12 个 。 也 就 是 说 ， 瑟 中 的 所 有 点 都 表示 A 为 第 一 张 牌 的 情况 。 选 择 A 的 方式 共有 4 种 ， 对 应 4 种 花 
色 的 选择 。 在 每 种 选择 中 ,第 二 张 牌 也 为 A 的 选择 都 有 3 和 种。 因此， 根据 4.4 节 介绍 的 技巧 ， 有 序 
选择 两 张 A 的 情况 共有 4x3 =12 种 。 

因此 ， 条 件 概 率 PROB(FIB) 是 12/204 ,或 者 说 是 1/117。 可 以 注意 到 ， 在 本 例 中 ，E 条 件 下 
的 概率 与 F 的 概率 并 不 相等 。 这 也 是 符合 直观 感受 的 。 当 第 一 张 牌 取 走 一 张 A 之 后 , 第 二 张 牌 再 
取 到 A 的 概率 就 下 降 了 。 那 时 候 , 剩 下 的 $1 张 牌 中 只 有 3 张 A， 而 3/$1 = 1/17。 与 之 相对 的 是 ， 如 
果 不 知 道 第 一 张 牌 是 什么 ,那么 第 二 张 牌 就 可 能 是 $2 张 牌 中 4 张 A 中 的 某 一 张 。 
4.10.1 独立 实验 

正如 示例 4.23、 示 例 4.26 和 示例 4.27 中 所 介绍 的 ， 有 时 候 建 立 的 概率 空间 会 表示 两 个 或 多 个 
实验 的 结果 。 在 最 简单 的 情况 下 ， 该 共同 概率 空间 中 的 点 是 结果 的 表 ， 每 个 表 代 表 一 项 实验 的 
结果 。 图 4-16 就 给 出 了 两 项 实验 联合 起 来 的 概率 空间 。 在 实验 结果 间 存 在 联系 的 情形 中 ， 共 同 
空间 中 可 能 会 丢失 一 些 点 。 示 例 4.27 就 讨论 了 这 样 的 情况 ， 其 中 共同 空间 表示 取 两 张 牌 且 结 
成 对 ， 其 中 不 可 能 取 到 两 张 相 同 的 牌 。 

实验 X 独 立 于 序列 中 前 序 实验 的 结果 。 从 直观 概念 上 讲 这 意味 着 的 各 种 结果 都 不 依赖 于 前 
序 实验 的 结果 。 因 此 ， 示 例 4.26 中 我 们 指出 找 第 二 颗 骨 子 是 独立 于 找 第 一 颗 骨 子 的 ， 而 在 示例 
4.27 中 ， 我 们 看 到 取 第 二 张 牌 的 实验 并 非 独 立 于 取 第 一 张 牌 的 实验 ， 因 为 取出 第 一 张 牌 后 ， 就 
不 可 能 再 次 取 到 这 张 牌 了 。 

在 定义 独立 性 时 ， 将 着 重 于 两 项 实验 的 关系 。 不 过 ， 因 为 任 一 实验 本 身 也 可 能 是 一 个 若干 
实验 构成 的 序列 ， 所 以 这 样 的 定义 有 效 地 涵盖 了 具有 很 多 实验 的 情况 。 首 先 必 须 了 解 表示 两 项 
成 功 实 验 久 和 加 的 结果 的 概率 空间 。 


+ 示例 4.28 

图 4-14 展 示 了 一 个 共同 概率 空间 ， 其 中 实验 总 是 第 一 颗 货 子 ， 而 实验 马 是 第 二 颗 人 般 子 。 这 
里 每 一 对 结果 都 是 用 一 个 点 表示 的 ， 而 这 些 点 的 可 能 性 是 相等 的 ， 都 等 于 1/36。 

在 示例 4.27 中 ， 我 们 讨论 过 表示 按 次 序 选取 两 张 牌 、 含 S2 个 点 的 概率 空间 。 该 空间 由 (C,D) 
这 样 的 牌 对 组 成 , 其 中 C 和 DD 分 别 是 某 张 扑克 牌 , 而 且 Cz#D 。 这 些 点 的 可 能 也 相同 , 都 是 1/2652。 

在 表示 马 接 着 马 的 结果 的 概率 空间 中 ， 存 在 表示 其 中 一 项 实验 的 结果 的 事件 。 也 就 是 说 ， 
如 果 <x 是 实验 六 可 能 出 现 的 结果 ， 就 有 一 个 事件 是 由 所 有 表示 第 一 项 实验 结果 为 的 点 组 成 的 。 
这 里 将 该 事件 称 为 已 。 同 样 ， 如 果 2 是 实验 叉 可 能 出 现 的 结果 ， 就 有 一 个 事件 丈 是 由 所 有 表示 第 
二 项 实验 结果 为 5 的 点 组 成 的 。 
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+ 示例 4.29 

在 图 4-16 中 ,EE 是 EF1， 就 是 表示 第 一 项 实验 结果 为 1 的 所 有 点 。 同 样 ，F 是 事件 FI， 就 是 那些 
表示 第 二 项 实验 结果 为 1 的 点 。 每 一 行 对 应 着 第 一 项 实验 6 种 可 能 结果 中 的 一 种 ， 而 每 一 列 则 对 
应 第 二 项 实验 6 种 可 能 结果 中 的 一 种 。 


1 
I (1;2) (1,3) (1,4) (1,5) (1,6) 





(2; 1) (2;2) (2,3) (2,4) (2, 5) (2, 6) 

(3, 1) (3,2) (3,3) (3, 4) (3, 5) (3, 6) 

(4, 1) (4,2) (4, 3) (4, 4) (4, 5) (4, 6) 

(5, 1) (3;2) (533) (5,4) (5,5) (5,6) 
六 

(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6) 





图 4-16 ”表示 第 一 颗 骨 子 或 第 二 颗 角 子 点 数 为 1 的 事件 


严格 地 讲 ， 如 果 对 卫 的 所 有 结果 a 以 及 及 的 所 有 结果 bp， 有 PROB( 由 | E,)= PROB( 古 )， 那么 
就 说 实验 总 是 独立 于 实验 入 的 。 也 就 是 说 ， 不 管 实验 马 的 结果 是 怎样 的 ， 实 验 马 各 结果 的 条 件 
概率 都 是 相同 的 ， 而 且 都 等 于 实验 马 在 整个 概率 空间 中 的 概率 。 


+ 示例 4.30 

回 到 图 4-16 表 示 搓 两 颗 货 子 的 概率 空间 ， 设 c 和 2 分 别 是 1 到 6 这 些 数 字 中 的 任意 一 个 。 用 脆 
表示 第 一 颗 般 子 为 c 的 事件 ， 胞 表示 第 二 颗 上 货 子 是 2 的 事件 。 不 难 注意 到 ， 这 些 事件 的 概率 均 为 
1/6， 它 们 各 自 排 成 一 行 或 一 列 。 对 任意 的 a 和 4b 来 说 ，PROB( |E,) 也 是 1/6。 我 们 在 示例 4.26 中 
已经 证 实 这 一 结论 在 a = 45=1 的 情况 下 是 成 立 的 , 不 过 同样 的 论证 过 程 也 适用 于 任意 两 个 结果 a 
和 b5， 因 为 它们 的 事件 只 有 一 个 点 是 相同 的 。 因 此 ， 撕 两 次 山子 是 相互 独立 的 。 

另 一 方面 ， 在 以 扑克 牌 为 例 的 示例 4.27 中 ， 就 不 存在 这 种 独立 性 。 因 为 ， 实 验 怠 是 第 一 张 
牌 的 选择 ， 而 实验 加 是 从 剩 下 的 有 牌 中 选择 第 二 张 牌 。 考 虑 诸如 ,这样 的 事件 ， 也 就 是 说 ， 第 
二 张 牌 为 黑 桃 A 的 情况 。 很 容易 便 能 得 出 该 事件 的 概率 PROB( FP ) 为 /152 的 结论 。 
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再 来 考虑 诸如 EE, ， 也 就 是 第 一 张 牌 为 草花 3 的 情况 。 同 在 已 , 和 下 ,中 的 点 只 有 一 个 ， 就 
是 点 (3$%,A4A )。 而 ,中 的 点 共有 51 个 ， 也 就 是 形 如 (3%,C ) 这 样 的 点 ， 其 中 C 是 除了 草花 3 之 外 
的 任意 一 张 牌 。 因 此 ， 条 件 概率 PROB( ,| ; ) 是 1/51， 而 不 是 1/52， 因 为 这 两 项 实验 不 是 相互 
独立 的 。 

可 以 考虑 一 个 更 极端 的 例子 ， 就 是 第 一 张 牌 为 黑 桃 A 的 事件 已 ，。 因 为 已 ,和 已 ,中 没有 相 
同 的 点 ， 所 以 PROB( ,15 ) 就 是 9， 而 不 是 1/52。 


4.10.2 ”概率 的 分 配 律 


有 时 候 , 如 果 先 将 概率 空间 划分 为 几 个 区 域 ”, 就 会 让 概率 的 计算 变 得 更 加 容易 。 也 就 是 说 ， 
每 个 点 都 只 出 现在 一 个 区 域 中 。 通 常 ， 概 率 空间 表示 一 系列 实验 的 结果 ， 而 表示 事件 的 区 域 则 
对 应 其 中 某 一 实验 可 能 出 现 的 结果 。 

假设 要 计算 被 分 为 RR 、R, 、…、R, 这 个 区 域 的 菜 个 具有 n 个 点 的 概率 空间 中 事件 的 概率 。 
简单 起 见 ， 假 设 所 有 点 的 概率 都 是 相同 的 ， 尽 管 就 算 它 们 的 概率 不 同 也 不 影响 结论 的 成 立 。 设 
事件 E 由 m 个 点 组 成 。 设 区 域 R 中 有 x 个 点 (i=1、2、…、k)。 最 后 , 设 E 中 处 于 区 域 R 中 的 点 
有 个。 请 注意 ，》 和 n=n 而且》 和 e =m。 原 因 和 皆 在 于 这 些 点 都 会 在 某 个 区 域 中 而 且 只 
会 在 一 个 区 域 中 。 

我 们 知道 PROB(E) =m/n ， 因 为 m/n 就 是 E 中 的 点 所 占 的 部 分 。 如 果 用 的 和 替代 m， 就 
得 到 

















PROB(E) = Be 
i=1 7 
接着 ,在 上 述 和 式 中 每 一 项 的 分 子 和 分 母 中 都 引入 因子 x 。 结 果 就 是 
PROB(E) = $s| 四 
i=1 \ Fi n 


现在 ,请 注意 x /n 就 是 PROB( R )， 也 就 是 说 ，7 /n 是 区 域 R 在 整个 概率 空间 中 所 占 的 部 分 。 
此 外 ，e; /x 就 是 PROB(E/1R)， 即 事件 RR 条件 下 事件 E 的 概率 。 换 句 话 说 ，e, /x 是 区 域 RR 中 
也 出 现在 E 中 的 点 的 比例 。 结 果 就 得 到 以 下 事件 E 概 率 的 计算 公式 。 


PROB(E) = y PROB(E|R)PROB(R ) (4.10) 











非 正 式 地 讲 ，E 的 概率 是 各 区 域 的 概率 乘 上 E 在 相应 区 域 中 的 概率 的 总 和 。 


+ 示例 4.31 

图 4-17 表 示 了 (4.10) 式 的 应 用 方式 。 图 中 展示 了 被 懂 直 划分 为 RR 、R, 和 RR 这 3 个 区 域 的 概率 
空间 。 其 中 事件 gE 是 青 度 用 线 勾 勒 出 的 。 设 a 到 /分别 是 所 示 6 个 组 中 点 的 数目 。 

设 n=at+b+ctqd+et+f 。 那 么 有 PROB(R)=(a+b)/n 、PROB( R,)=(c+d)/n ， 而 且 
PROB( R, )= (e+ 了/)/n。 而 事件 在 这 3 个 区 域 的 条 件 概率 分 别 是 PROB( E|R, )=a/(a+b)、 
PROB(E|R, )=c/(c+d) ,而且 PROB(E|R, )=e/(e+/)。 现 在 来 评估 (4.10) 式 ， 就 有 





(D “区 域 ” 指 的 就 是 “事件 ”， 也 就 是 概率 空间 的 子 集 。 不 过 ,这 里 使 用 术语 “区 域 ” 是 为 了 强调 这 是 将 概率 空间 
分 为 完全 禾 盖 整个 区 域 又 不 互相 重 盖 的 事件 。 
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图 4-17 分 为 区 域 的 概率 空间 


PROB( E ) = PROB( E|R, )PROB( R )+PROB( E|R, )PROB( R, )+PROB( E|R, )PROB( R, ) 
如 果 将 该 式 用 a 到 /的 参数 表示 ， 就 是 


PRop(B)=| a | C /3 e [S252 

a+b n ctd n e+f n n n n 

请 注意 ， 直 接 将 标记 有 a、c、e 的 3 块 中 点 的 数目 与 整个 空间 的 大 小 相 比 ， 也 能 得 到 同样 的 结果 。 
(at+c+e)/n 这 一 分 数 正 是 上 式 给 出 的 E 的 概率 ， 这 一 结果 证 明了 (4.10) 式 。 


+ 示例 4.32 

现在 利用 (4.10) 式 计算 事件 已 “ 按 次 序 取 两 张 扑 克 牌 均 是 A” 的 概率 。 概 率 空间 是 示例 4.27 
中 讨论 过 的 那 2652 个 点 。 这 里 要 将 该 空间 分 为 Ri 、 尺 两 个 区 域 。 

R1: 第 一 张 牌 为 A 的 那些 点 。 总 共有 4 x 51 = 204 个 这 样 的 点 ， 因 为 第 一 张 牌 为 A 的 情况 有 4 
种 ， 而 每 种 情况 下 对 应 的 第 二 张 牌 都 有 51 种 选择 。 

R,: 剩 下 的 2448 个 点 。 
这 种 情况 下 ，(4.10) 式 束 成 了 

PROB( E ) = PROB( E|R, )PROB( R )+PROB( E|R, )PROB( R,) 

显然 PROB( ER )， 也 就 是 RR, 条件 下 E 的 条 件 概率 ,为 0。 如 果 第 一 张 牌 不 为 A， 那么 不 可 能 拿 到 
两 张 A， 因 此 必须 计算 PROB( ER )PROB( R )， 而 这 个 值 就 是 PROB( EB )。 现 在 有 PROB( RR) 
=204/2652 = 1/13。 换 句 话 说， 第 一 张 牌 拿 到 A 的 可 能 性 是 1/13。 因 为 总 共有 13 种 秩 ， 所 以 这 一 
概率 是 说 得 通 的 。 

现在 需要 计算 PROB(E|R )。 如 果 第 一 张 牌 是 A， 那 么 剩 下 的 51 张 牌 中 还 剩 3 张 A。 因 此 ， 
PROB(EIR )=3/51=1/17 。 因 此 可 以 得 出 结论 : PROB(E)=(1/17)Q/13)=1/221。 








+ 示例 4.33 

现在 用 (4.10) 式 来 计算 事件 已“ 掷 3 颗 骨 子 ， 至 少 出 现 一 个 1 点 ”的 概率 ， 就 像 示 例 4.16 中 描 
述 过 的 掷 仍 子 游 戏 那样 。 首 先 ,我 们 一 定 要 理解 ， 那 个 例子 中 描述 的 “结果 ”的 概念 与 概率 空 
间 中 的 点 并 不 匹配 。 在 示例 4.16 中 ， 我 们 建立 的 概率 空间 有 56 种 不 同 的 “结果 ”， 这 是 骨 子 出 现 
1 到 6 点 的 次 数 。 例 如 ,， “一 个 4 点 、 一 个 5 点 和 一 个 6 点 ”是 一 种 结果 ， 而 “两 个 3 点 和 一 个 4 点 ” 
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是 男 一 种 结果 。 然而, 这 种 情况 下 各 种 结果 的 概率 并 不 相同 。 特 别 要 说 的 是 ，3 个 数字 者 不 同 的 
概率 是 某 个 数字 出 现 两 次 的 概率 的 两 售 ， 是 3 个 角子 数字 都 相同 的 概率 的 6 信 。 

尽管 可 以 使 用 点 对 应 示例 4.16 中 那 种 “结果 ”的 概率 空间 ， 不 过 考虑 按 顺 序 掷 仍 子 ， 从 而 
构建 一 个 包含 的 点 概率 相等 的 概率 空间 要 更 为 自然 。 这 样 一 来 就 有 6 =216 种 不 同 的 结果 与 按 次 
序 掷 3 次 骨 子 的 事件 对 应 ， 而 每 个 结果 的 概率 均 为 1216。 

我 们 可 以 不 使 用 (4.10) 式 ， 而 是 直接 计算 至 少 有 一 颗 货 子 为 1 点 的 概率 。 首 先 ， 计 算 没 有 1 














出 现 的 情况 数 。 可 以 为 3 颗 货 子 分 配 2 到 6 之 中 的 任 一 数字 。 这 样 概率 空间 中 不 含 1 的 点 共有 
$ =125 人 个， 所 以 有 1 的 点 就 有 216-125 =91 个 。 因 此 ，PROB(E)91/216 ， 大 约 为 42%。 


上 述 方法 虽然 简短 , 但 需要 使 用 些许 “技巧 ”。 计算 这 一 概率 的 男 一 种 方式 是 “强行 ”将 概 
率 空 间 分 为 3 个 区 域 ， 对 应 出 现 一 个 数字 、 两 个 不 同 数 字 或 3 个 不 同 数字 的 情况 。 设 是 具有 i 
个 不 同 数字 的 点 所 在 的 区 域 。 可 以 按照 下 列 方式 计算 各 区 域 的 概率 。 就 R 而 言 ， 总 共有 6 个 点 ， 
也 就 是 3 个 般 子 均 为 1 到 6 这 些 点 时 的 情况 。 就 RR 而 言 ， 根 据 4.4 节 中 的 规则 ， 从 6 个 数字 中 选 出 3 
个 不 同 的 数字 共有 6x5x4=120 种 方式 。 因 此 ,中 一 定 是 具有 剩 下 的 216-6-120=90 个 点 。” 
各 区 域 的 概率 分 别 是 PROB( R )=6/216=1/36 、PROB( R ) =90/216=5/12 、 
PROB( R,)=120/216=5/9。 

接着 要 计算 条 件 概 率 。 如 果 出 现 了 6 个 数字 中 的 3 个 数字 ， 那 么 其 中 一 个 为 1 的 概率 是 1/2。 
如 果 出 现 了 2 个 数字 ,那么 至 少 出 现 一 次 1 的 概率 是 113。 如 果 只 有 一 个 数字 出 现 ,那么 该 数字 为 
1 的 概率 是 1/6。 因 此 PROB(E|R )=1/6 、PROB(E|R, )=1/3 ， 而 且 PROB(E|R, )=1/2 。 将 这 些 
概率 都 代入 (4.10) 式 中 ， 就 得 到 

PROB(E )= (1/6)(/36)+(/3)(5/12)+(1/2)(5/9) 
=1/216+5/36+5/18=91/216 

当然 ， 这 一 分 数 和 直接 计算 的 结果 是 吻合 的 。 如 果 能 理解 直接 计算 中 的 那些 “诀窍 ”， 那 么 直接 
计算 的 方法 是 相当 容易 的 。 不 过 , 将 问题 分 为 若干 区 域 往往 是 一 种 更 为 可 靠 的 保障 成 功 的 方式 。 
4.10.3 独立 实验 的 乘积 法 则 

一 类 常见 的 概率 问题 是 求 一 系列 独立 实验 的 一 系列 结果 的 概率 。 在 这 种 情况 下 , (4.10) 式 具 
有 了 特别 简单 的 形式 ， 表 明 这 一 系列 结果 的 概率 就 是 每 一 结果 概率 的 乘积 。 

首先 ， 将 概率 空间 等 分 为 个 区 域 ， 就 会 对 所 有 的 有 PROB(R)=1/k ， 因 此 (4.10) 式 可 以 简 
化 为 











PROB( E )= > PROB( E|R, ) (4.11) 


看 待 (4.11) 式 的 一 种 实用 方式 是 将 E 的 概率 视 为 各 区 域 条 件 下 E 的 概率 的 平均 值 。 
现在 考虑 表示 两 项 独立 实验 和 Y 和 名 的 结果 的 概率 空间 。 可 以 将 该 空间 分 为 个 区 域 , 每 个 区 
域 都 是 点 的 集合 , 这 些 点 表示 具有 某 个 特定 值 的 咏 的 结果 , 这 样 每 个 区 域 都 具有 相同 的 概率 1/k。 
假设 要 计算 事件 E“ 康 的 结果 为 a， 是 有 % 的 结果 为 ”的 概率 ， 可 以 使 用 (4.11) 式 。 如 果 Rj 不 
是 对 应 六 的 结果 ao 的 区 域 ， 那么 PROB( ER )=0。 因 此 ，(4.11) 式 中 就 只 剩 下 a 区 域 的 项 了 。 如 果 
说 该 区 域 为 R,， 就 得 到 








J 可 以 直接 计算 该 数字 ， 用 选择 会 出 现 两 次 的 点 数 的 6 种 方式 ， 乘 上 选择 其 余 角 子 点 数 的 5 种 方式 ,再 乘 上 选择 只 
出 现 一 次 的 那个 数字 所 在 位 置 的 G) = 3 种 方式 。 就 是 6x5x3=90 种 方式 。 
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PROB( EF )= - PROB( E 


PROB( ER, ) 是 什么 ? 它 是 在 已 的 结果 为 a 的 条 件 下 ,“ 马 的 结果 为 ga， 且 闷 的 结果 为 2” 的 概 
率 。 因 为 给 定 了 角 的 结果 为 4a， 所 以 PROB( ER, ) 是 在 部 的 结果 为 a 的 条 件 下 ， 驰 的 结果 为 的 概 
率 。 又 因为 和 如 是 相互 独立 的 ， 所 以 PROB( EIR, ) 就 是 钱 的 结果 为 bp 的 概率 。 如 果 五 可 能 有 m 种 
结果 ,那么 PROB( IR ) 就 是 1/m。 那 么 (4.12) 式 就 成 了 


1Y1 
Proa(E)- [| 二 
我 们 可 将 上 述 推理 一 般 化 为 针对 任意 数量 的 实验 。 想 这 样 做 ,可 以 令 实验 总 是 一 系列 实验 ， 
并 通过 对 独立 实验 总 数量 的 归纳 来 证 明 ， 有 着 特定 序列 的 全 部 结果 的 概率 等 于 每 个 结果 的 概率 


的 乘积 。 





R,) (4.12) 























利用 独立 性 简化 计算 

如 果 知 道 实验 是 相互 独立 的 ,就 有 很 多 机 会 简化 概率 计算 。 乘积 法 则 是 一 个 例子 。 另 一 个 
例子 就 是 ， 只 要 有 是 表示 实验 加 特定 结果 的 点 集合 ，F 是 另 一 个 独立 实验 郧 特定 结果 的 点 集合 ， 
那么 就 有 PROB( E|F )= PROB(E )。 

原则 上 讲 , 分 辨 两 项 实验 是 否 相 互 独立 是 个 复杂 的 任务 , 涉及 对 表示 实验 结果 对 的 概率 空 
间 的 检测 。 不过， 通常 可 以 借助 该 情形 的 物理 特性 ,在 不 进行 这 种 计算 的 情况 下 得 出 实验 互相 
独立 的 结论 。 例 如 ， 在 依次 括 朋 子 时 ， 不 存在 物理 学 上 的 原因 令 一 次 投掷 的 结果 能 影响 其 他 投 
搓 的 结果 ， 所 以 它们 背 定 是 独立 实验 。 而 从 牌 堆 中 取 牌 则 与 搓 蜗 子 的 情况 不 同 。 因 为 取出 的 牌 
是 无 法 在 随后 的 过 程 中 被 再 次 取出 的 ， 所 以 不 用 指望 连续 取 牌 是 相互 独立 的 事件 。 事 实 上 ， 我 
们 已 在 示例 4.29 中 看 到 了 这 种 独立 性 的 缺失 。 





+ 示例 4.34 

电话 号 码 后 四 位 为 1234 的 概率 是 0.0001。 每 一 位 号 码 的 选择 都 是 有 0 到 9 这 10 种 可 能 结果 的 
实验 。 其 次 ， 每 一 位 的 选择 都 独立 于 其 他 位 的 选择 ， 因 为 这 里 进行 的 是 4.2 节 中 介绍 的 “有 放 回 
的 选择 ”。 第 一 位 是 1 的 概率 为 110。 同样 ， 第 二 位 是 2 的 概率 为 /10， 而 其 他 两 位 的 情况 也 是 一 
样 的 。 所 以 4 位 数字 依次 为 1234 的 概率 就 是 (1/10)*= 0.0001。 


4.10.4 ”习题 


(1) 使 用 图 4-14 所 示 的 概率 空间 ， 给 出 如 下 事件 对 的 条 件 概率 。 
(a) 在 第 一 颗 货 子 为 奇数 的 条 件 下 ， 第 二 颗 山 子 是 偶数 。 
(b) 在 第 二 颗 货 子 至 少 为 3 的 条 件 下 ， 第 一 颗 货 子 是 偶数 。 
(c) 在 第 一 颗 仍 子 为 4 的 条 件 下 ， 两 颗 货 子 点 数 之 和 至 少 为 7。 
(d) 在 两 颗 仍 子 点 数 之 和 为 8 的 条 件 下 ， 第 二 颗 仍 子 是 3。 
(2) 将 掷 仍 子 〈 见 示例 4.16 ) 游戏 的 概率 空间 按照 示例 4.33 所 示 划 分 为 3 个 区 域 ， 使 用 这 一 划分 方式 与 
4.10 式 计算 如 下 概率 。 
(a) 至 少 出 现 两 个 1] 点 。 
(b) 3 颗 骨 子 都 是 1 点 。 
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(c) 刚好 有 一 颗 仍 子 是 1 点 。 

(3) 证 明 : 在 掷 3 颗 仍 子 的 游戏 中 ，3 颗 骨 子 点 数 均 不 同 的 概率 ， 是 有 两 颗 货 子 出 现 同一 点 数 的 概率 的 
两 倍 ， 是 3 颗 货 子 点 数 均 相同 的 概率 的 6 倍 。 

(4) * 通过 对 n 的 归纳 证 明 ， 如 果 有 n 项 实验 ， 而 且 每 一 项 实验 都 是 相互 独立 的 ， 那 么 任 一 系列 结果 的 
概率 等 于 对 应 实验 各 项 结果 概率 的 乘积 。 

(5)* 证 明 : 如 果 有 PROB( |E )=PROB( 五 )， 则 有 PROB( 下 |E )=PROB( 巨 )。 并 证 明 : 如 果实 验 久 独立 
于 实验 多， 那么 有 也 独立 于 多 |。 

(6)* 考虑 从 W 和 工 中 作出 选择 组 成 的 长 度 为 7 个 字母 的 序列 的 集合 。 可 以 将 其 视 为 表示 7 场 4 胜 制 比 赛 的 
结果 的 序列 ， 其 中 w 表 示 第 一 文 队 伍 获 得 1 场 比 赛 的 胜利 ， 而 LL 表示 第 二 支队 伍 获 胜 。 哪 支队 伍 先 
取得 4 场 胜 利 则 赢得 这 场 系列 赛 (因此 , 有 些 比赛 可 能 从 未 进行 过 , 不 过 我 们 需要 将 其 假设 结果 包 
含 在 这 些 点 中 ， 从 而 获得 各 点 概率 相等 的 概率 空间 ) 。 

(a) 在 某 支 队伍 取得 第 一 场 比赛 胜利 的 条 件 下 ， 该 队 在 这 个 系列 赛 中 取胜 的 概率 ? 
(b) 在 某 支 队伍 取得 前 两 场 比赛 胜利 的 条 件 下 ， 该 队 在 这 个 系列 赛 中 取胜 的 概率 ? 
(c) 在 某 支 队伍 取得 前 三 场 比赛 胜利 的 条 件 下 ， 该 队 在 这 个 系列 赛 中 取胜 的 概率 ? 

(7) ** 有 3 个 囚犯 4、3 和 C。 他 们 得 知 ? 人 中 有 一 个 要 被 枪决 ， 而 且 狱 警 知 道 要 枪决 谁 。4 让 狱警 告诉 
他 其 他 两 个 内 犯 中 哪个 不 会 被 枪决 。 狱 警告 诉 4，B 不 会 被 枪决 。 

4 推理 要 么 是 他 ， 要 么 是 C 被 枪决 ， 所 以 4 被 枪决 的 概率 是 1/2。 男 一 方面 ， 对 4 进行 推理 ,不管 谁 
被 枪决 ,狱警 都 知道 4 之 外 的 某 人 不 会 被 枪决 ， 所 以 他 总 能 回答 4 的 问题 。 因 此 ,通过 该 问题 的 提 
问 和 回答 都 不 能 判定 4 是 否 会 被 枪决 ， 所 以 4 将 被 枪决 的 概率 仍 是 13 ， 就 像 在 提出 问题 之 前 的 概 
率 那 样 。 

那么 在 经 过 上 述 系 列 事件 后 ，4 将 被 枪决 的 真实 概率 是 多 少 ? 提示 : 需要 构建 合适 的 概率 空间 ， 
不 只 要 表示 囚犯 被 选中 枪决 的 实验 ， 而 且 要 表示 狱警 有 权 选 择 回答 “B” 或 “C” 的 情况 下 作出 某 
种 选择 的 实验 的 概率 。 

(8)* 假设 EB 是 处 在 被 分 为 RR、R,、…、Ri 这 kK 个 区 域 的 空间 中 的 事件 。 证 明 : 

PROB(R,)PROB(E|R,) 

> ‘PROB(R,)PROB(E|R,) 

该 公式 被 称 为 贝 叶 斯 定理 ( Bayes’ Rule ), 它 给 出 了 在 已 知 E 的 条 件 下 R 的 概率 的 值 ,针对 示例 4.31， 

使 用 贝 叶 斯 定理 计算 PROB( R|E )、PROB( R,|E ) 和 PROB( R,|E )。 


























PROB( R,|E )= 


4.11 概率 推理 


概率 在 计算 机 领域 的 一 项 重要 应 用 就 是 用 在 事件 预测 系统 的 设计 中 。 其 中 一 个 例子 就 是 医疗 
诊断 系统 。 理 想 状 态 下 ,诊断 过 程 包含 执行 检测 或 观察 症状 ， 直 到 检测 结果 或 特定 症状 的 出 现 与 
否 使 医生 足以 确定 患者 所 患 的 疾病 为 止 。 然 而 ， 在 实际 操作 中 ， 诊 断 很 少 是 确定 无 疑 的 。 诊 断 出 
的 只 是 最 为 可 能 的 疾病 ,或 者 是 在 进行 检测 和 观察 症状 的 实验 条 件 下 ， 条 件 概率 最 大 的 疾病 。 

现在 来 考虑 一 个 特别 简单 的 例子 ， 此 例 就 利用 了 概率 的 诊断 风格 。 假 设 已 知 当 患 者 出 现 头 
痛 时 ， 他 患 流感 的 概率 为 50%， 也 就 是 

PROB( 流 感 | 头痛 ) =0.5 

在 上 式 中 ,我 们 将 “流感 ”解释 为 “患者 得 了 流感 ”这 一 事件 的 名 称 。 同 样 ,“ 头 痛 ” 是 “患者 
自称 头痛 ”这 一 事件 的 名 称 。 
假设 还 知道 当 患 者 的 体温 达到 或 超过 38.9 摄 氏 度 时 , 该 患者 得 流感 的 概率 是 60%。 如果 将 “发 烧 ” 
作为 “患者 体温 至 少 为 38.9 摄 氏 度 ”这 一 事件 的 名 称 ， 就 可 以 将 这 一 结论 写 为 
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PROB( 流 感 | 发 烧 ) =0.6 
现在 ,考虑 如 下 诊断 情形 。 某 患者 来 看 医生 ,表示 自己 有 头痛 的 症状 。 医 生 为 他 量 了 体温 ， 
发 现 他 的 体温 是 38.9 摄 氏 度 ， 那 么 该 患者 患 流 感 的 概率 是 多 少 ? 
这 种 情形 如 图 4-18 所 示 。 其 中 有 “流感 "、“ 头 痛 ” 和 “发 烧 ”3 个 事件 ， 将 该 空间 分 为 8 个 
区 域 , 这 里 分 别 用 a 到 h 这 些 字母 表示 这 些 区域 。 例如 , c 就 是 “患者 具有 头痛 症状 而 且 患 了 流感 ， 
但 不 发 烧 ” 这 一 事件 。 











a 








发 烧 
图 4-18 “流感 "、“ 头 痛 ” 和 “发 烧 " 事件 
给 定 的 这 些 概 率 信息 对 图 4-18 中 事件 的 大 小 提出 了 一 些 限制 。 若 不 仅 用 a 到 表示 图 4-18 中 
的 那些 区 域 ， 还 用 这 些 字母 表示 对 应 事件 的 概率 。 那 么 条 件 概率 PROB( 流 感 | 头痛 ) =0.5 就 表示 
区 域 ctf 的 和 是 “头痛 ”事件 总 大 小 的 一 半 ， 或 者 换 种 形式 就 是 
c+f=d+g (4.13) 
同样 ，PROB( 流 感 | 发 烧 ) =0.5 这 一 事实 表示 et/ 是“ 发烧” 事件 总 大 小 的 315， 或 者 说 














e+/=>(g+) (4.14) 


现在 来 解说 “在 发 烧 和 头痛 同时 出 现 的 条 件 下 ， 患 流感 的 概率 是 多 少 ” 这 一 问题 。 实 情 就 
是 ， 发 烧 和 头痛 同时 出 现 的 情况 表明 要 么 是 在 区 域 ,/ 中 ， 要 么 是 在 区 域 g 中 。 在 区 域 了 中 时 流感 
的 诊断 是 正确 的 ， 而 在 区 域 e 中 时 则 不 是 。 因 此 ， 上 患 流 感 的 概率 束 是 f /(f + 8g) 。 

那么 f/(f+g) 的 值 是 多 少 呢 ? 答案 可 能 有 点 怀 人 。 显 然 没有 任何 关于 “流感 ”事件 概率 
的 信息 ， 它 可 能 是 0， 也 可 能 是 1， 还 可 能 是 0 和 1 之 间 的 任意 数字 。 下 面 有 两 个 例子 ， 它 们 分 别 
表示 图 4-18 所 示 概 率 空间 中 的 点 有 可 能 出 现 的 实际 分 布 情况 。 
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+ 示例 4.35 

假设 图 4-18 中 与 众 事件 关联 的 概率 分 别 是 : 4 = f =0.3 ，a = 有 h=0.2， 而 其 他 4 个 区 域 的 概 
率 都 是 0。 请 注意 ， 这 些 值 都 满足 (4.13) 式 和 (4.14) 式 给 出 的 限制 。 在 本 例 中 ，f/(f+g)=1， 也 
就 是 说 ， 同 时 有 头痛 和 发 烧 症 状 的 患者 肯定 得 了 流感 。 那 么 图 4-18 中 的 概率 空间 实际 就 成 了 图 
4-19 所 示 的 样子 。 从 该 图 中 可 看 出 ， 只 要 患者 同时 有 发 烧 和 头痛 的 情况 ,那么 他 肯定 患 了 流感 ， 
而 且 反 过 来 ， 只 要 他 得 了 流感 ， 那 么 肯定 有 发 烧 和 头痛 的 症状 。” 








图 4-19 ” 当 “ 发 懂 ” 和 “头痛 ”确保 “流感 ”时 的 空间 示例 





+ 示例 4.36 

另 一 个 例子 是 给 定 概 率 c=g=0.2 ，a=e=0.3 ， 而 其 他 概率 则 是 0。(4.13) 式 和 (4.14) 式 还 
是 能 得 到 满足 。 不 过 ,现在 f/(f+g)=0。 也 就 是 说 ， 如 果 患 者 同时 有 发 烧 和 头痛 的 情况 ， 那 
么 他 肯定 不 会 得 流感 。 这 一 表述 相当 可 疑 ， 不 过 (4.13) 式 和 (4.14) 式 又 不 能 推倒 这 一 表述 。 这 一 
情形 如 图 4-20 所 示 。 





图 4-20 ” 当 “ 发 烧 ” 和 “头痛 ”确保 不 “流感 ”时 的 空间 示例 





QD 虽然 也 有 5b 寺 0 的 其 他 例子 ， 也 就 是 患者 患 了 流感 却 既 不 发 烧 也 不 头痛 ,但 还 是 有 f /(f +g)=1。 





4.11 概率 推理 165 





4.11.1 ”OR 结合 的 两 个 事件 的 概率 


如 果 没 法 分 辨 上 述 情形 中 当 患 者 既 发 烧 又 头痛 时 会 发 生 人 什么， 我们 可 能 想 知道 有 没有 什么 
可 说 的 。 在 更 简单 的 情形 下 ， 事 件 结合 时 概率 的 行为 其 实 是 有 一 些 限 制 的 。 最 简单 的 情况 可 能 
就 是 用 析 取 ( disjunction ) 或 者 说 逻辑 OR ( 逻辑 “或 ”) 结合 两 个 事件 时 的 情况 了 。 


+ 示例 4.37 
再 来 看 看 图 4-18。 假设 已 知 在 任意 时 间 , 有 2% 的 人 发 烧 , 上 且 有 3% 的 人 感到 头痛 。 也 就 是 说 ， 
“发 烧 ” 事 件 的 大 小 为 0.02， 而 “头痛 ”事件 的 大 小 为 0.03。 那 么 ， 有 发 烧 或 头痛 中 任 一 种 情况 ， 
或 是 两 种 情况 都 有 的 人 所 占 比 例 是 多 大 呢 ? 
答案 是 至 少 有 一 种 症状 的 人 所 占 比例 在 3% 到 5$% 之 间 。 要 知道 为 何 ， 用 图 4-18 定 义 的 8 个 区 
域 来 进行 一 些 计 算 吧 。 如 果 “ 发 烧 ” 的 概率 为 0.02， 也 就 是 说 
et+h+f+g=0.02 (4.15) 
如 果 “ 头 痛 ” 的 概率 是 0.03， 那 么 有 
ctd+f+g=0.03 (4.16) 
之 前 的 问题 是 至 少 有 一 种 症状 的 区 域 为 多 大 ， 也 就 是 问 et+h+f+g+c+4d 有 多 大 。 
如 果 将 (4.15) 和 (4.16) 相 加 ， 就 得 到 e+h+2(f+g)+c+d =0.05 ,或 者 换 种 方式 表示 : 
et+h+f+gt+c+d=0.05-(f+g) (4.17) 
因为 “发 烧 OR 头 痛 ” 的 概率 是 (4.17) 式 的 左边 部 分 ， 所 以 (4.17) 式 的 右边 部 分 0.05 一 (f+g) 也 是 
这 一 概率 。 
+g 至少 为 0， 所 以 “发 烧 OR 头 痛 ” 的 概率 最 高 是 0.05， 不 可 能 超过 0.05。 也 就 是 说 ， 头 
痛 和 发 烧 的 症状 有 可 能 从 不 同时 出 现 。 那 么 区 域 f 和 g 都 为 空 , 而 e+h=0.02, 上 且 c+d=0.03。 
在 这 种 情况 下 ,“ 发 烧 OR 头 痛 ” 的 概率 是 “发 懂 ” 的 概率 与 “头痛 ”的 概率 之 和 。 
那么 f+g 的 最 大 值 可 能 是 多 少 ?” 当然 ，f +g 既 不 可 能 大 于 整个 “发 烧 ” 事件， 也 不 可 能 
大 于 整个 “头痛 ”事件 。 因 为 “发 烧 ” 更 小 , 所 以 可 知 f+g 和 0.02。 因 此 ,“ 发 烧 OR 头 痛 ” 的 
最 小 概率 可 以 是 0.05- 0.02， 也 就 是 0.03。 这 一 结果 正好 是 两 个 事件 中 较 大 的 “头痛 ”事件 的 概 
率 ， 这 并 非 巧合 。 换 种 方式 看 ,“ 发 伐 OR 头 痛 ” 概 率 的 最 小 值 会 在 两 个 事件 中 较 小 那个 完全 被 
较 大 那个 包含 时 出 现 。 在 本 例 中 ， 这 种 情况 会 在 e+h=0， 也 就 是 “发 烧 ” 完 全 包含 在 “头痛 ” 
中 时 出 现 。 在 那 种 情况 下 ， 除 非 有 涉 痛 ,不然 不 会 发 民 ， 所 以 “发 烧 OR 尖 痛 ” 的 概率 就 是 “ 尖 
痛 ” 的 概率 一 一 0.03。 
现在 可 以 将 示例 4.37 中 的 探索 一 般 化 为 针对 任意 两 个 事件 ， 求 和 规则 如 下 所 示 。 如 果 E 和 FF 
是 任意 两 个 事件 ， 而 G 是 E 或 FP 有 一 个 发 生 或 两 者 都 发 生 的 事件 ， 那 么 
max(PROB(E),PROB(F)) PROB(G) PROB(E)+PROB(F) (4.18) 
也 就 是 说 ，E-OR-F 的 概率 是 在 E 的 概率 和 FF 的 概率 中 较 大 者 与 二 者 的 和 之 间 。 
同样 的 概念 放 在 任意 其 他 事件 瓦 中 也 成 立 。 也 就 是 说 ，(4.18) 中 的 所 有 概率 都 可 以 是 某 事 件 
有 条 件 下 的 条 件 概率 ， 这 样 就 能 给 出 更 具 概 括 性 的 规则 : 
max(PROB(E | H),PROB(F | PD)< PROB(G | HF) PROB(E | D+PROB(F | D) (4.19) 












































+ 示例 4.38 
假设 在 图 4-18 所 示 情 形 中 已 知 得 流感 的 人 中 有 70% 会 发 烧 ， 而 且 得 流感 的 人 中 有 80% 会 头 
痛 。 那 么 在 (4.19) 中 ,，“ 流 感 ” 就 是 事件 如 ,就 是 “发 烧 ” 事 件 ，F 是 “头痛 ”，G 是 “头痛 OR 
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发 烧 ”。 已 知 PROB(E | 刀 = PROB( 发 烧 | 流感 ) = 0.7， 而 PROB(F | 媚 = PROB( 头 痛 | 流感 ) = 0.8。 
规则 (4.19) 表 示 PROB(G | 太 至 少 是 0.7 和 0.8 中 的 较 大 者 。 也 就 是 说 ， 如 果 患 了 流感 ， 那 么 发 
烧 或 头痛 或 两 种 情况 都 有 的 概率 至 少 是 0.8。 规 则 (4.19) 还 表明 PROB(G | 如 至 多 是 
PROB(E | H) + PROB(F | DH) 
或 者 说 是 0.7+0.8 =1.5 。 不 过 这 一 上 界 是 没有 意义 的 ， 因 为 事件 的 概率 不 可 能 大 于 1， 所 以 1 才 
是 PROB(G | 轧 更 佳 的 上 界 。 


4.11.2 ”AND 结合 的 事件 的 概率 


假设 已 知 “ 发 烧 ” 的 概率 是 0.02， 而 “头痛 ”的 概率 是 0.03。 那 么 “发 伐 AND 头 痛 ” 的 概 
率 是 多 少 ? 也 就 是 说 ， 一 个 人 同时 有 发 伐 和 头痛 证 状 的 概率 是 多 少 ? 就 像 之 前 两 个 事件 OR 结合 
的 情况 那样 ， 没 办 法 给 出 精确 的 值 ， 不 过 有 时 候 可 以 为 两 个 事件 的 合 取 〈 conjunction ) 或 者 说 
逻辑 AND ( 人 逻辑 “与 ”) 的 概率 给 出 一 些 限制 。 

在 图 4-18 的 情况 下 ， 是 要 问 f+g 可 以 有 多 大 。 我 们 已 经 得 知 ， 如 果 用 OR 关 系 连 接 事件 ， 
那么 当 两 个 事件 中 较 小 者 〈 在 该 情况 下 是 “发 烧 ” 事 件 ) 完全 被 男 一 个 事件 包含 时 ，f+g 会 
有 最 大 值 。 那 么 ,“ 发 烧 ” 事 件 的 概率 都 集中 在 /+g 中 ,而 且 有 f+g=0.02 ， 也 就 是 “发 烧 ” 
事件 单独 的 概率 。 一 般 而 言 ， 两 个 事件 AND 结 合 的 概率 不 会 超过 较 小 者 的 概率 。 

那么 f+g 可 以 有 多 小 ? 显然 ， 没 什么 情况 能 阻止 “发 烧 ” 和 “头痛 ”完全 没 交 集 的 情况 
出 现 ， 所 以 f+g 是 可 以 为 0 的 。 也 就 是 说 ， 可 能 没 人 同时 具有 发 烧 和 头痛 的 症状 。 

不 过 上 述 想 法 并 不 具有 一 般 性 。 假 设 事件 “发 烧 ” 和 “头痛 ”并 不 是 0.02 和 0.03 这 样 的 微小 
概率 ， 而 是 分 别 有 着 60% 和 70% 的 概率 。 那 么 还 可 能 说 没 人 同时 具有 发 烧 和 头痛 的 症状 吗 ? 如 果 
在 这 种 情况 下 还 有 /+g = 0 , 那么 就 有 e+h=0.6 , 而 且 c+d =0.7。 这 样 一 来 e+h+c+d=1.3， 
也 就 是 说 ， 图 4-18 中 的 事件 et+h+c+4q 的 概率 就 大 于 1 了 ， 而 这 是 不 可 能 的 。 

显然 ,两 个 事件 的 AND 连 接 的 大 小 不 能 比 两 事件 概率 之 和 减 1 还 小 。 否 则 ， 相 同 的 两 个 事件 
的 OR 连 接 的 概率 就 会 大 于 1。 这 一 结论 是 在 乘积 法 则 中 总 结 出 来 的 。 如 果 有 和 天 是 两 个 事件 ， 而 
G 事 件 是 指 忆 和 同时 发 生 ， 那 么 

PROB(E)+PROB(F) -1 PROB(G)< min(PROB(E), PROB(A)) 
与 求 和 规则 一 样 ， 相 同 的 概念 也 适用 于 男 一 事件 条件 下 的 情况 。 也 就 是 有 
PROB(E | +PROB(F | PD) -1<PROB(G | Dmin(PROB(E | FH),PROB(F | PD) (4.20) 
































+ 示例 4.39 

再 来 看 看 图 4-18。 假设 患 流 感 的 人 中 有 70% 会 发 烧 , 而 且 有 80% 会 头痛 。 那么 有 多 少 人 同时 
有 发 烧 和 头痛 症状 ? 根据 (4.20)， 其 中 万 为 “流感 ”事件 ， 那 么 在 某 人 患 流 感 的 条 件 下 ， 同 时 有 
发 伐 和 头痛 症状 的 概率 至 少 是 0.7+0.8-1= 0.5 ， 至 多 是 min(0.7,0.8) = 0.7 。 





涉及 若干 事件 的 规则 总 结 


下 面 的 内 容 对 本 节 介 绍 的 规则 和 4.10 节 中 有 关 独 立 事件 的 规则 进行 了 总 结 。 假 设 事件 已 和 不 
的 概率 分 别 为 p 和 9g， 那 么 有 下 列 结论 。 
口 事件 尼 or 严 ( 即 已 和 严 至少 有 一 个 发 生 ) 的 概率 至 少 是 max(p,q)， 且 至 多 是 ptq (或 者 如 
果 ptg > 1， 就 是 1 )。 
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口 事件 E-and-F( 即 巨 和 严 同时 发 生 ) 的 概率 至 多 是 min(p,g)， 且 至 少 是 p+g-1 (或 者 如 果 
ptq <1， 就 是 0 )。 

口 如 果 E 和 是 相互 独立 的 事件 ， 那 么 E-and-F 的 概率 就 是 pq。 

口 如 果 B 秘 是 相互 独立 的 事件 ， 那 么 E-or-F 的 概率 就 是 ptqg-pgq。 

最 后 一 个 规则 可 能 要 党 些 思量 。E-or-F 的 概率 是 p+ g 减 去 事件 同时 发 生 的 那 部 分 空间 ， 因 
为 在 将 E 和 FF 的 概率 相 加 时 那 部 分 空间 被 计算 了 两 次 。 而 同 在 EB 和 中 的 点 正好 是 事件 E-and-F， 
它 的 概率 就 是 pg， 因 此 ， 

PROB(E-Or-F) = PROB(E) +PROB(F) -PROB(E-and-F) = p+qg-pq 

下 图 展示 了 这 若干 事件 之 间 的 关系 。 


E-and-F 





E-or-F 
概率 =p+g-pg 





4.11.3 ”处 理事 件 间 关系 的 一 些 方法 


在 那些 需要 计算 复合 事件 ( 就 是 辕 干 其 他 事件 的 AND 或 OR 结果 事件 ) 的 概率 的 应 用 中 , 往 
往 不 需要 知道 确切 的 概率 。 不 过 ， 我 们 需要 确定 最 可 能 的 情形 或 者 说 高 概率 ( 即 概率 接近 1 ) 
的 情形 。 因 此 ， 只 要 能 推 新 出 事件 的 概率 为 “高 "， 复 合 事件 的 概率 范围 就 不 太 可 能 会 寓 来 大 
问题 。 

例如 ， 在 示例 4.35 引 入 的 医疗 诊断 问题 中 ， 我 们 可 能 永远 都 没 法 推断 出 患者 患 流感 的 概率 
为 1。 不 过 只 要 结合 观察 到 的 症状 和 患者 未 出 现 的 症状 , 就 能 得 出 他 患 流 感 的 概率 非常 高 , 将 患 
者 诊断 为 流感 就 应 该 是 很 明智 的 。 

然而 ， 我 们 发 现在 示例 4.3$ 中 ， 基 本 上 说 不 出 同时 具有 头痛 和 发 烧 症 状 的 患者 患 流感 的 概 
率 ， 即 便 知 道 每 种 症状 都 能 强 有 力 地 表示 患者 患 了 流感 ， 也 是 如 此 。 真 正 的 推理 系统 需要 更 多 
用 来 估算 概率 的 信息 或 规则 。 作 为 一 个 简单 的 例子 ,可 以 明确 给 出 PROB。 流感 | 头痛 AND 发 烧 。 
这 一 概率 ， 这 样 就 可 以 立刻 解决 该 问题 。 

不 过 , 如 果 将 El1、E,、…、E 这 nn 个 事件 结合 起 来 得 出 男 一 个 事件 ,那么 就 需要 明确 给 出 2"-1 
个 不 同 的 概率 ， 这 些 概率 分 别 是 在 51、E,、…、E, 中 一 个 或 多 个 形成 的 条 件 下 FF 的 条 件 概 率 。 
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+ 示例 4.40 

对 n=2 的 情况 ， 比 如 示例 4.35 的 情况 ,就 只 需要 给 出 3 个 条 件 概 率 。 因 此 ， 正 如 之 前 所 做 
的 那样 ， 我 们 可 以 断言 PROB( 流 感 | 发 烧 ) = 0.6 且 PROB( 流 感 | 头痛 ) = 0.5。 然 后 ， 可 以 加 上 诸如 
PROB( 流 感 | 头痛 AND 发 烧 ) = 0.9 这 样 的 信息 。 

要 避免 指定 指数 数量 条 件 概 率 的 情况 出 现 ， 有 很 多 种 限制 可 帮助 我 们 推断 或 估计 概率 。 一 
项 简单 的 限定 就 是 声明 某 一 事件 表明 另 一 事件 ， 也 就 是 说 ， 第 一 个 事件 是 第 二 个 事件 的 子 集 。 
通常 ， 这 样 的 信息 能 提供 一 些 有 用 的 东西 。 


+ 示例 4.41 

假设 我 们 声明 只 要 患者 患 流感 ， 他 一 定 会 头痛 。 那 么 按 图 4-18 来 看 ， 可 以 说 区 域 和 e 是 空 
的 。 同 时 假设 只 要 患者 患 流感 ， 他 一 定 会 发 烧 。 那 么 图 4-18 中 的 区 域 c 也 是 空 的 。 图 4-21 就 表示 
依据 这 两 项 假设 简化 后 的 图 4-18。 











图 4-21 这 里 ,“ 流 感 ”发 生 就 表示 “头痛 ”和 “感冒 ”都 发 生 


在 5b、c 和 e 都 为 0 的 条 件 下 ,假设 PROB( 流 感 | 头痛 ) = 0.5 且 PROB( 流 感 | 发烧) = 0.6， 就 可 以 
将 (4.13) 式 和 (4.14) 式 改写 为 





J=ditg 
3 


Fe 


因为 4 和 h 都 至 少 为 0%， 所 以 第 一 个 等 式 说 明 f 三 g ， 而 第 二 式 说 明 f 宇 3g /2。 

再 来 看 看 同时 有 发 烧 和 头痛 症状 的 条 件 下 患 流感 的 概率 ， 即 PROB( 流 感 | 头痛 AND 发 烧 )。 
该 条 件 概率 在 图 4-18 或 图 4-21 中 都 是 f/(f+g) ,因为 /三 3g/12 ,所 以 可 得 出 f/(f+g) 宇 0.6 的 
结论 。 也 就 是 说 ， 同 时 有 头痛 和 发 烧 症状 的 患者 患 流感 的 概率 至 少 是 0.6。 

可 以 将 示例 4.41 推 广 到 任意 3 个 事件 中 一 个 事件 意味 着 另 两 个 事件 的 情况 。 假 设 这 些 事件 分 
别 是 Z、F 和 G， 那 么 




















PROB(E|IG)= PROB(FIG) = 1 
也 就 是 说 ， 只 要 G 发 生 ，E 和 肯定 会 发 生 。 进 一 步 假设 PRoB(BIG) =p， 且 PROB(GIF)=gq， 则 有 
PROB(G|E£-and-F) 宇 max(p,g) (4.21) 
如 果 将 图 4-21 中 的 “流感 "、“ 发 烧 "、“ 头 痛 ” 分 别 解释 为 G、E、f， 就 可 以 看 出 (4.21) 式 的 
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推理 是 成 立 的。 那么 有 p=f/(f+g+ 有 有 上 且 gqg=f/(f+g+d)。 因 为 4 和 hh 至少 为 0%， 所 以 可 得 知 
Pp 三 f/(f+g) 有 是 gq 三 f/(f+g)。 而 f/(f+g) 就 是 PROB(G|E-and-F)。 因 此 ， 该 条 件 概 率 大 于 
等 于 p 和 gq 二 者 中 的 较 大 者 。 


4.11.4 “习题 


(1) 将 求 和 规则 和 乘积 法 则 推广 到 两 个 以 上 的 事件 上 。 也 就 是 说 ， 如 果 记 、E,、…、E, 这 些 事件 的 概率 
分 别 是 pi、 PpP2、~ "~ Pn; 那么 回答 下 列 问题 。 
(a) n 个 事件 中 至 少 有 一 件 发 生 的 概率 是 多 少 ? 
(b) a 个 事件 全 部 发 生 的 概率 是 多 少 ? 
(2)* 如 果 PROB(FIE) =p， 那 么 以 下 概率 分 别 是 多 少 ? 
(a) PROB(FI E ) 
(b) PROB( F |E) 
(c) PROB(F |E) 
回想 一 下 ，E 是 5 的 互补 事件 ， 而 是 F 的 互补 事件 。 

(3) 智能 建筑 控制 会 试 着 预测 夜晚 是 否 会 “ 冷 ”， 也 就 是 说 晚间 温度 至 少 比 白天 温度 低 20 华 氏 度 ( 约 
6.7 摄 氏 度 ) 的 情况 。 如 果 控 制 系统 知道 日 落 前 照 在 它 传 感 器 上 的 阳光 指数 为 高 ,那么 当晚 会 冷 的 
概率 就 是 60%， 因 为 显然 是 没有 云层 ， 使 得 热量 更 容易 从 地 面 散 逸 。 而 且 控 制 系统 还 知道 ， 如 果 
日 落后 一 小 时 内 温度 的 变化 至 少 达到 5 度 ( 约 1.67 摄 氏 度 ) ,那么 晚上 会 冷 的 概率 就 是 70%。 将 这 
3 个 事件 分 别 表 示 为 “ 冷 ”、“ 高 ”和 “ 降 ”， 并 假设 PROB( 高 ) = 0.4 且 PROB( 降 ) = 0.3。 

(a) 给 出 PROB( 高 -AND- 降 ) 的 上 限 和 下 限 。 

(b) 给 出 PROB( 高 -OR- 降 ) 的 上 限 和 下 限 。 

(c) 假设 还 知道 只 要 晚上 会 很 冷 ， 那 么 阳光 传 感 需 的 读数 就 会 高 ， 而 且 日 落后 温度 至 少 下 降 4 度 ， 
即 PROB( 高 | 冷 ) 和 PROB( 降 | 冷 ) 都 是 1。 给 出 PROB( 冷 | 高 -AND- 降 ) 的 上 限 和 下 限 。 

(d) ** 在 与 (c) 小 题 相同 的 假设 下 ， 给 出 PROB( 冷 | 高 -OR- 降 ) 的 上 限 和 下 限 。 请 注意 ， 本 题 所 需 的 推 
理 在 本 节 中 并 未 提 及 。 

(4) 在 很 多 情况 下 ， 比 如 示例 4.35 的 情况 ， 两 个 或 多 个 事件 会 相互 强化 某 一 结论 。 也 就 是 说 ， 我 们 从 
直觉 上 期 望 不 管 PROB( 流 感 | 头痛 ) 是 多 少 , 得 知 患 者 有 发 烧 及 头痛 的 证 状 都 能 提高 流感 的 概率 。 假 
设 如 果 PROB(GIE-AND- 站 二 PROB(GIA) 就 说 事件 E 强 化 了 结论 G 中 的 事件 Ff。 证 明 : 如 果 事 件 E 和 玉 
在 结论 G 中 互相 强化 ， 那 么 有 (4.21) 式 成 立 。 也 就 是 说 ，E-AND-F 条 件 下 G 的 概率 ， 不 小 于 E 条 件 
下 G 的 条 件 概 率 与 F 条 件 下 G 的 条 件 概 率 中 的 较 大 者 。 
































概率 推理 的 其 他 应 用 


本 节 中 我 们 已 经 看 到 了 概率 推理 的 一 种 重要 应 用 : 医疗 推理 。 下 面 还 列 出 了 其 他 一 些 领域 ， 在 这 些 

领域 中 有 一 些 相似 的 概念 出 现在 计算 机 解决 方案 中 。 

口 系统 诊断 。 设 备 出 现 故 障 ， 表 现 出 一 些 不 正常 的 行为 。 例 如 ， 计 算 机 屏幕 一 片 空 白 ， 

但 硬盘 还 在 运转 。 导 致 这 一 问题 的 原因 是 什么 ? 

口 统筹 性 规划 。 给 定 经 济 条 件 的 概率 ， 比 如 通货 膨胀 以 及 某 种 商品 供给 的 减少 等 ， 哪 种 战 
略 的 成 功 概 率 最 大 ? 

口 智能 家 电 。 多 种 高 端 家 电 可 以 使 用 概率 推理 ( 常 被 称 为 “模糊 逻辑 ”) 为 用 户 作出 决定 。 
例如 ， 洗 衣 机 可 以 旋转 并 称 量 它 盛装 的 衣物 ， 预 测 最 有 可 能 的 面料 ( 比如 免 流 材料 或 羊 
毛 ) ， 并 据 此 调整 洗衣 的 程序 。 
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4.12 ”期 望 值 的 计算 


通常 ， 实 验 可 能 出 现 的 结果 都 有 相关 联 的 值 。 在 本 节 中 ， 我们 将 利用 一 些 简 单 的 博彩 游戏 
作为 示例 ， 在 这 些 游戏 中 启 钱 或 输 钱 取 决 于 实验 的 结果 。 而 在 下 一 节 中 ,我 们 还 将 讨论 计算 机 
科学 领域 更 复杂 的 示例 ， 即 计算 某 些 算法 预期 运行 时 间 的 例子 。 

假设 拥有 某 个 概率 空间 ， 以 及 该 空间 中 点 上 的 收益 函数 六 j 的 期 望 值 就 是 FoOJPROBHCO 上 所 
有 点 x 的 和 。 用 EV 表示 该 值 ， 当 所 有 点 都 是 等 可 能 时 ， 可 以 通过 

(1) 将 空间 中 所 有 x 对 应 的 f(x) 相 加 ， 然 后 

(2) 将 和 值 除 以 空间 中 点 的 数目 ， 
计算 该 期 望 值 EVOY)。 该 期 望 值 有 时 被 称 为 均值 ， 而 且 可 以 被 视 作 “重心 ”。 


+ 示例 4.42 

假设 该 概率 空间 是 表示 投 一 颗 公 平角 子 的 结果 的 6 个 点 ， 这 些 点 会 自然 而 然 地 被 视 为 1 到 6 
这 些 整 数 。 设 该 收益 函数 为 恒 等 函 数 f0)=i ,i= 1、2、…、6， 那 么 -的 期 望 值 就 是 

EV(/)= (f(D+f2)+f3)+ f+ LS)+ /6))/6 
=(l1+2+3+4+5+6)/6=21/6=3.5 

也 就 是 说 ,一 颗 角 子 投 出 点 数 的 期 望 值 是 3.5。 

再 看 一 个 例子 ， 设 g 是 收益 函数 g(i) = 六 。 那 么 ， 对 同样 的 实验 
值 e 为 

















投 一 上 颗 骨 子 ， 期 望 


EV(g)=(1 ?+2*+3:+4*+5*+6’)/6 
=(1+4+9+16+25+36)/6=91/6=15.17 
非 正 式 地 讲 ， 一 颗 般 子 掷 出 点 数 平方 的 期 望 值 是 15.17。 


+ 示例 4.43 

再 来 考虑 示例 4.16 首 次 引入 的 皂 般 子 游戏 。 该 游戏 的 收益 规则 如 下 。 玩 家 对 某 个 数字 下 注 1 
美元 。 如 果 该 数字 出 现 1 次 或 多 次 , 那么 该 玩家 就 会 得 到 该 数字 出 现 次 数 那么 多 的 美元 。 如 果 该 
数字 未 出 现 ， 那 么 该 玩家 就 会 输 掉 他 下 注 的 那些 钱 。 

掷 蜗 子 游戏 的 概率 空间 是 由 1 到 6 这 几 个 数字 的 三 元 组 构成 的 216 个 点 。 这 些 点 表示 搓 三 颗 般 
子 的 结果 。 我 们 假设 玩家 下 注 的 数字 是 1。 很 明显 可 知 ， 只 要 这 些 货 子 都 是 公平 的 ， 该 玩家 输赢 
钱 数 的 期 望 值 就 与 他 下 注 的 数字 无 关 。 

该 游戏 的 收益 函数 /为 下 列 情况 。 

(1) g(Gi, j,k) = 一 1 ， 如 果 i、j 和 都 不 为 1。 也 就 是 说 ， 如 果 没 出 现 1 点 ， 那 么 玩家 将 会 输 挥 他 
下 注 的 那 1 美元 。 

(2) gGC 六 和 =1， 如 果 六 或 中 刚好 有 一 个 为 1。 

(3) g(G, j,k)=2 ， 如 果 i、 或 中 刚好 有 两 个 为 1。 

(4) g(i, j,k)=3， 如 果 i、j 和 Kk 都 为 1。 

接 下 来 的 问题 就 是 求 e 在 这 216 个 点 上 的 平均 值 。 因 为 枚 举 所 有 的 点 会 很 乏味 ， 所 以 最 好 是 
先 试 着 分 别 数 出 4 种 不 同 结 果 对 应 的 点 的 数量 。 

首先 ， 看 看 3 颗 骨 子 都 不 是 1 点 的 情况 有 和 多少 种 。 如 果 没 有 1， 则 每 个 位 置 有 5 个 数字 可 供 选 
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择 , 所 以 这 就 成 了 4.2 节 中 的 分 配 问题 。 因 此 , 没有 1 的 情况 共有 5$ =125 种 。 按照 上 述 的 规则 (1)， 
这 125 个 点 为 收益 的 和 值 贡 献 了 -125S。 

接着 , 数 一 下 3 颗 货 子 刚 好 有 一 颗 为 1 点 的 情况 有 多 少 。! 可 以 出 现在 3 个 位 置 中 的 任何 一 个 。 
对 每 个 存放 1 的 位 置 ， 剩 下 两 个 位 置 都 可 以 从 5 个 数字 中 选择 。 因 此 ， 刚 好 有 一 个 1 的 点 共有 
3x5xs=75 个 。 根 据 规 则 (2)， 这 些 点 为 收益 贡献 了 +75。 

而 3 颗 货 子 都 为 1 的 情况 显然 只 有 一 种 ， 所 以 这 一 概率 为 收益 作出 了 +3 的 贡献 。 而 剩 下 的 
216-125-72-1=15S 个 点 肯定 是 有 两 个 1 的 ， 所 以 根据 规则 (2)， 这 些 点 贡献 了 +30 的 收益 。 

最 后 , 将 4 类 点 对 应 的 收益 值 都 加 起 来 ,并 除 以 概率 空间 中 点 的 总 数目 , 便 能 得 出 该 游戏 收 
益 的 期 望 值 ， 因 此 得 到 

EV(f)=(-125+75+30+3)/216=-17/216=-0.079 

也 就 是 说 ， 玩 家 平均 每 下 注 1 美 元 就 会 输 掉 约 8 美 分 。 这 一 结果 可 能 会 让 人 吃惊 ， 因 为 游戏 表面 
上 看 起 来 是 一 次 机 会 平等 的 打赌 。 这 一 点 将 在 本 节 的 习题 中 加 以 讨论 。 

正如 示例 4.43 所 表示 的 ， 有 时候 根据 收益 子 数 的 值 将 概率 空间 中 的 点 分 组 也 更 易于 计算 。 
一 般 而 言 , 假设 有 某 个 收益 函数 为 /的 概率 空间 , 而 且 / 只 产生 有 限 数量 的 不 同 值 。 例 如 ， 在 示例 




















4.43 中 ，j 产 生 的 值 具 有 -1、1、2 和 3。 对 每 个 由 /产生 的 值 v， 设 及 是 由 满足 f(x) =y 的 点 xz 组 成 的 
事件 。 也 就 是 说 ， 玉 是 让 产生 值 v 的 点 的 集合 ， 那 么 
EV(f)= >》vPROB(E) (4.22) 





在 这 些 点 概率 相同 的 一 般 情况 下 ， 设 n, 是 事件 EB, 中 点 的 数 日 ， 并 设 n 是 该 概率 空间 中 点 的 总 
数 。 那 么 PROB(EB,) 就 是 awn， 这 样 就 可 以 有 


EV(7) -Em J" 


+ 示例 4.44 

在 示例 4.25 中 ， 我 们 介绍 了 基诺 游戏 ， 并 计算 了 在 5 个 数字 里 猜 中 3 个 的 概率 。 现 在 来 计算 
一 下 基诺 5 点 游戏 收益 的 期 望 值 。 回 想 一 下 ， 在 5 点 游戏 中 ， 玩 家 要 从 1 到 80 中 竞 猪 5 个 数字 。 在 
游戏 开始 后 , 会 从 1 到 80 这 些 数 字 中 选取 20 个 。 如 果 这 20 个 数字 中 有 3 个 或 3 个 以 上 与 玩家 所 选 的 
5 个 数字 相同 ， 那 么 玩家 就 中 奖 了 。 

不 过 ， 收 益 取 决 于 玩家 所 选 的 $ 个 数字 中 猜 对 了 多 少 个 。 通 常 ， 如 果 下 注 1 美 元 ， 那 么 玩家 
所 选 5 个 数字 中 要 是 猿 中 3 个 , 就 可 以 得 到 2 美元 , 也 就 是 有 1 美元 的 净 收 益 。 如 果 他 所 选 的 5 个 数 
字 中 有 4 个 是 对 的 ， 就 将 得 到 15 美 元。 如 果 5 个 数字 全 对 ， 就 能 赢得 300 美 元 的 奖励 。 如 果 猜 中 的 
数字 不 足 3 个 ， 就 不 会 得 到 奖励 ， 并 会 输 掉 他 投注 的 那 1 美元。 

在 示例 4.25 中 ， 我 们 计算 出 5 个 数字 中 猿 对 3 个 的 概率 是 0.08394 ( 保留 4 位 有 效 数字 )。 同 样 ， 
可 以 计算 出 5 个 数字 中 猜 对 4 个 的 概率 是 0.01209， 而 5 个 数字 全 对 的 概率 是 0.0006449。 那 么 ， 猜 对 
的 数字 不 足 3 个 的 概率 就 是 1 减 去 这 些小 数 ， 或 者 说 约 为 0.90333。 少 于 3 个 、 对 3 个 、 对 4 个 和 对 5 个 
的 收益 分 别 为 -1、+1、+14 和 +299。 因 此 ， 利 用 (4.22) 式 就 能 得 出 基诺 5 点 游戏 的 期 望 收益 ， 就 是 

0.90333x(-D+0.08394x1+0.01209x14+0.0006449x299 = -0.4573 

因此 ， 玩 家 平均 每 在 该 游戏 中 投注 1 美元 ， 就 大 约会 损失 46 美 分 。 


习题 


(1) 证明 : 如 果 掷 3 颗 仍 子 ， 出 现 1 点 的 预期 数量 是 1/2。 
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(2) * 只 要 有 1 就 能 中 奖 ， 而 没有 1 就 不 中 ,那么 ， 为 什么 习题 (D) 中 的 事实 并 不 意味 着 掷 般 子 游 戏 是 
场 机 会 平等 的 游戏 ( 即 在 1 或 任 一 数字 上 下 注 的 期 望 收益 为 0 ) ? 

(3) 假设 在 基诺 4 点 游戏 中 ， 玩 家 要 竞猜 4 个 数字 ， 而 回报 如 下 : 猜 中 两 个 数字 ,得 1 美元 ( 即 玩家 可 以 
拿 回 他 下 注 的 那 1 美 元 ) ; 猜 中 3 个 数字 ， 得 4 美元 ; 4 个 数字 全 中 ， 得 50 美 元 。 那 么 回报 的 期 望 值 
是 多 少 ? 

(4) 假设 在 基诺 6 点 游戏 中 回报 如 下 : 狂 中 3 个 ， 得 1 美元 ; 猜 中 4 个 ， 得 4 美元 ; 猜 中 5 个 ， 得 25 美 元 ; 
全 中 ， 得 1000 美 元 。 那 么 回报 的 期 望 值 是 多 少 ? 

(5) 假设 要 玩 6 颗 仍 子 的 掷 货 子 游 戏 。 玩 家 会 为 某 个 数字 下 注 1 美 元 ， 然 后 掷 出 仍 子 。 他 选择 的 数字 每 
出 现 一 次 ， 就 会 得 到 1 美元 的 奖励 。 例 如 ， 如 果 出 现 一 次 ， 那 么 净 回 报 为 0; 如 果 出 现 两 次 ， 则 净 
回报 为 +1， 等 等 。 那 么 这 是 种 公平 游戏 ( 即 回报 的 期 望 值 为 0 ) 吗 ? 

(9* 根据 习题 (3) 表 示 的 回报 设计 , 我 们 可 以 对 标准 形式 的 撕 3 颗 山子 的 游戏 的 回报 规则 加 以 改变 , 让 
玩家 可 以 下 注 一 定数 额 。 那么 玩家 下 注 的 数字 出 现 一 次 他 就 会 得 到 1 美元 。 为 了 使 游戏 成 为 一 场 公 
平 游戏 ， 玩 家 应 该 下 注 多 少 才 合适 ? 


4.13 ”概率 在 程序 设计 中 的 应 用 


在 本 节 中 ， 我 们 将 考虑 概率 计算 在 计算 机 科学 中 的 两 类 应 用 。 第 一 类 是 对 算法 期 望 运行 时 
间 的 分 析 。 第 二 类 则 是 一 种 和 被 称 为 “蒙特 卡 洛 ” 算 法 的 新 算法 ， 因 为 这 种 算法 具有 不 正确 的 
风险 。 而 正如 我 们 将 看 到 的 ， 通 过 对 参数 的 调整 ， 是 有 可 能 将 壹 特 卡 洛 算法 正确 的 概率 提高 到 
令 人 满意 的 程度 的 ， 只 不 过 没 法 让 正确 的 概率 达到 1， 或 者 说 绝对 正确 。 


4.13.1 概率 分 析 


考虑 以 下 简单 问题 。 假设 有 一 个 含 n 个 整数 的 数组 ,并 询问 某 整 数 x 是 否 为 数组 A[0. .n-1] 
中 的 项 。 图 4-22 所 示 的 算法 就 是 完成 这 一 工作 的 。 请 注意 ， 它 会 返回 BOOLEAN (布尔 ) 类 型 ， 
在 1.6 节 中 已 经 定义 过 它 是 int 类 型 的 ， 而 且 还 定义 了 常量 TRUE 和 FALSE， 它 们 分 别 表 示 1 和 0。 














BOOLEAN find(int x, int A[], int n) 
{ 


int i; 


(1) for(i = 0; i < n; i++) 
(2) if (A[i] == x) 

(3) return TRUE ; 
(4) return FALSE; 








图 4-22 ”在 大 小 为 的 数组 4 中 找 出 元 素 x 


第 (1) 到 第 (3) 行 会 检查 数组 中 的 每 一 项 ， 而 且 如 果 在 数组 中 找到 x， 就 立即 终止 循环 并 返回 
TRUE 作 为 答案 。 而 如 果 未 找到 x， 则 会 到 达 第 (4) 行 并 返回 FALSE。 设 循环 体 以 及 循环 的 递增 与 
测试 所 花 的 时 间 为 c。 设 第 (4) 行 和 循环 初始 化 所 花 的 时 间 为 d。 那么 如 果 未 找到 zx， 图 4-22 所 示 函 
数 的 运行 时 间 就 是 cn+qd ， 也 就 是 O(n) 。 

不 过 ,假设 找到 了 x， 那 么 图 4-22 所 示 函 数 的 运行 时 间 又 是 多 少 ? 显然 ， 越 早 找到 x， 所 花 
的 时 间 就 越 少 。 如 果 x 因 某 种 原因 一 定 是 在 A[0] 位 置 ， 那么 所 花 的 时 间 就 是 OQ) ， 因 为 循环 只 
会 迭代 一 次 。 不 过 如 果 x 总 是 在 末尾 或 接近 末尾 ， 那 么 所 花 的 时 间 就 会 是 O(n) 。 
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当然 ， 最 坏 的 情况 就 是 我 们 在 最 后 一 步 才 找到 x， 所 以 O(n) 就 是 最 坏 情况 下 的 平滑 紧 上 界 。 
不 过 ,平均 情况 有 没有 可 能 比 O(n) 好 得 多 呢 ? 要 解决 这 一 问题 ， 就 需要 定义 一 个 概率 空间 ， 其 
中 的 点 都 表示 x 可 能 在 的 位 置 。 最 简单 的 假设 就 是 x 会 等 可 能 地 被 放置 在 数组 4 中 的 任意 一 个 位 置 。 
如 有 果 这 样 的 话 ， 该 概率 空间 就 有 n 个 点 ， 每 个 点 分 别 表示 数组 4 下 标的 界限 0 到 -1 这 些 整 数 。 

接着 问题 又 来 了 : 在 该 概率 空间 中 ， 图 4-22 所 示 也 数 运行 时 间 的 期 望 值 是 多 少 ? 考虑 该 空 
间 中 的 点 i，i 可 以 是 从 0 到 -1 中 的 任 一 个 。 如 果 x 是 在 A[i] 的 位 置 ， 循 环 就 会 迭代 i+1 次 。 因 
此 运行 时 间 的 上 界 就 是 ci+4d 。 不 过 这 一 界限 略 有 常数 4 的 偏差 , 因为 第 (4) 行 从 未 执行 过 。 不过， 
这 一 差异 是 无 关 紧 要 的 ， 因 为 在 将 运行 时 间 转 换 为 大 0 表达 式 时 ，4d 就 会 被 消去 了 。 

因此 我 们 必须 求 出 函数 f(i) = cz+d 在 本 概率 空间 中 的 期 望 值 。 将 i 从 0 到 nn-1 时 的 cita 相 
加 ， 并 除 以 点 的 总 数量 x， 就 得 到 


OO 


对 较 大 的 x， 该 表达 式 的 值 约 为 cn/2 。 因 此 ，0O(n) 就 是 该 期 望 值 的 平滑 紧 上 界 。 也 就 是 说 ,在 
大 约 为 2 的 常数 因子 内 ,这 个 期 望 值 与 最 坏 的 情况 是 相同 的 。 这 一 结果 从 直觉 上 讲 是 成 立 的 。 如 
果 x 等 可 能 地 出 现在 数组 中 的 任意 位 置 ， 它 “通常 会 ”在 数组 的 某 一 半 中 ， 因 此 大 约 只 需要 下 x 
根本 不 在 数列 中 或 在 最 后 一 个 元 素 的 位 置 时 一 半 的 工夫 即 可 。 


4.13.2 ”使 用 概率 的 算法 


图 4-22 所 示 的 算法 是 确定 的 ， 它 总 是 对 同样 的 数据 进行 同样 的 处 理 。 只 有 对 期 望 运行 时 间 
的 分 析 利 用 到 了 概率 的 计算 。 几 乎 我 们 遇 到 的 每 种 算法 都 是 确定 的 。 不 过 ， 有 一 些 问题 靠 虽 不 
确定 但 会 以 某 种 基本 方式 从 概率 空间 中 进行 选择 的 算法 能 更 好 地 得 到 解决 。 从 假想 的 概率 空间 
中 进行 这 样 的 选择 并 不 难 ， 方 法 就 是 利用 4.9 节 中 介绍 的 随机 数 生成 融 。 

一 类 常见 的 概率 算法 是 蒙特 卡 洛 自 法， 在 每 次 迭代 时 会 进行 随机 选择 。 根 据 这 一 选择 ， 它 
既 有 可 能 说 “ 真 ” ， 就 是 保证 会 得 到 正确 答案 的 情况 ， 也 有 可 能 说 “我 不 知道 ， 就 是 正确 答案 
既 可 能 为 “ 真 ”也 可 能 为 “ 假 ”的 情况 。 其 可 能 性 如 图 4-23 中 的 概率 空间 所 示 。 























算法 说 “我 不 知 
道 ”， 但 答案 为 


“ 真 
~ 


答案 为 “ 假 ”， 算 法 说 “我 不 知道 ” 





图 4-23 ”蒙特 卡 洛 算法 一 次 迭代 可 能 的 结 


174 第 4 章 ”组合 与 概率 





在 答案 为 真 的 条 件 下 ,算法 说 “ 真 ”的 概率 是 a/(a+b) 。 也 就 是 说 ， 该 概率 是 网 4-23 中 给 
定 a 或 5 的 条 件 下 事件 a 的 条 件 概率 。 只 要 该 概率 p 大 于 0, 就 可 以 随便 和 欠 代 多 少 次 , 并 迅速 减 小 失 
败 的 概率 。 通 过 “失败 ”"， 我 们 表示 了 正确 答案 为 “ 真 "， 但 算法 中 没有 哪 次 迭代 可 以 得 出 这 一 
结果 。 

为 每 次 迭代 都 是 独立 实验 , 如 有 果 正 确 答 案 是 “ 真 ”, 而 且 要 迭代 n 次 , 那么 算法 从 不 说 “ 真 ” 
的 概率 是 (1-p)”。 只 要 1-p 是 严格 小 于 1， 就 知道 (1-p)" 会 随 着 n 的 增长 迅速 减 小 。 例 如 ， 如 
果 p=1/2，, 那么 1-p 也 是 1/2。n=10 时 , (0.57 大约 是 1/11000( 见 4.2 节 附注 栏 内 容 )，n = 20 时 ， 
这 个 量 约 是 1/1 000 000， 等 等 。n 每 增加 10， 这 个 量 就 缩小 约 1000 倍 。 

蒙特 卡 洛 算法 会 进行 次 这 样 的 实验 。 如 果 任 意 实验 的 答案 都 为 “ 真 "， 那 么 算法 的 答案 也 
为 “ 真 "。 如 果 所 有 答案 都 为 “ 假 ”， 那 么 算法 的 答案 为 “ 假 "。 因 此 ， 

(1) 如 果 正 确 答案 是 “ 假 ”， 该 算法 一 定 会 回答 “ 假 ”。 

(2) 如 果 正 确 答案 是 “ 真 "， 该 算法 有 (1-p)" 的 概率 回答 “ 假 "， 我们 可 以 假设 这 一 概率 非 
常 小 ， 因 为 选择 了 足够 大 的 xz 来 使 它 很 小 。 该 算法 回答 “ 真 ”的 概率 是 1-(1- p)”， 这 个 值 很 可 
能 是 非常 接近 1 的 。 
因此 ， 当 正确 答案 为 “ 假 ” 时 是 不 会 失败 的 ， 而 当 正 确 答案 为 “ 真 ” 时 也 几乎 很 难 失败 。 


+ 示例 4.45 

本 例 要 讲 一 个 用 蒙特 卡 洛 算法 解决 起 来 更 有 效 的 问题 。XYZ 计 算 机 公司 订购 了 若干 箱 世 片 ， 
这 些 芯片 应 该 在 出 厂 前 都 经 过 测试 以 确保 都 是 良品 。 不 过 ，XYZ 公 司 相 信和 某 几 箱 芯 片 在 出 厂 前 
未 经 过 检测 ， 在 这 种 情况 下 任 一 芯片 不 合格 的 概率 是 1/10。XYZ 公 司 有 种 简单 的 解决 方法 ， 就 
是 亲自 检测 收 到 的 全 部 芯片 , 不 过 这 一 过 程 既 费 钱 又 费时 。 如 果 一 箱 中 有 7z 缺 芯 片 ， 对 该 箱 芯片 
进行 测试 所 花 的 时 间 就 是 O(n) 。 

更 佳 的 方式 是 利用 蒙特 卡 洛 算法 。 从 每 箱 芯片 中 随机 选 出 i 夫 进 行 测试 。 如 果 某 块 芯片 是 坏 
的 ， 就 回答 “ 真 ” 表示 该 箱 芯片 在 出 三 前 未 经 过 测试 ， 不 然 这 块 坏 芯片 当时 就 被 检 出 了 。 
如 果 该 芯片 是 合格 的 ， 就 回答 “我 不 知道 ”， 并 继续 检测 下 一 块 芯片 。 如 果 测 试 的 j 赤 芯 片 全 是 
良品 ， 那 么 就 声明 整 箱 芯片 都 是 良品 。 

就 图 4-23 而 言 ， 区 域 c 就 表示 从 一 箱 合格 芯片 中 选 出 芯片 的 情况 ;区域 2 是 某 箱 芯片 未 经 测 
试 , 但 芯片 凑巧 合格 的 情况 ; 而 区 域 c 则 是 某 箱 芯片 未 经 测试 , 而 且 芯片 不 合格 的 情况 。 之 前 “如 
果 某 箱 世 片 未 经 测试 则 有 1L/10 的 芯片 不 合格 ”这 一 假设 表示 圆 形 区 域 c 的 面积 是 封闭 椭圆 区 域 c 
和 2 面积 的 十 分 之 一 。 

现在 来 计算 一 下 失败 的 概率 即 i 坎 芯片 全 合格 , 但 该 箱 芯片 未 经 测试 。 在 测试 完 一 块 芯片 之 
后 说 “我 不 知道 ”的 概率 1-1/10 = 0.9 是 。 因 为 测试 每 块 芯片 的 事件 都 是 独立 的 , 所 以 对 有 块 芯片 
都 说 “我 不 知道 ”的 概率 是 (0.9)*, 假 设 选择 k=131。 那 么 失败 的 概率 就 是 (0.9) 1, 大 约 是 0.000001， 
或 者 说 是 百 万 分 之 一 。 也 就 是 说 ， 如 果 某 箱 芯 片 是 合格 的 ， 就 永 不 会 在 该 箱 中 找 出 不 合格 的 世 
片 , 所 以 我 们 可 以 笃定 该 箱 芯 片 是 合格 的 。 如 果 某 箱 芯片 未 经 测试 , 那么 在 测试 的 131 块 芯片 中 
发 现 不 合格 芯片 的 概率 是 0.999999， 而 且 会 说 该 箱 忆 片 需要 全 面 测试 。 有 0.000001 的 概率 是 ,， 革 
箱 芯片 未 经 测试 但 我 们 还 说 这 是 一 箱 合格 芯片 ， 而 且 不 需要 测试 该 箱 芯片 中 的 其 余 世 片 。 

该 算法 的 运行 时 间 为 Od) 。 也 就 是 说 ,测试 至 多 131 块 芯片 的 事件 是 个 与 箱 中 所 装 芯 片 数 n 
无 关 的 常量 。 因 此 ， 与 更 直观 的 测试 全 部 芯片 的 算法 相 比 ,测试 每 箱 芯片 的 时 间 开 销 从 O(n) 降 
到 了 O00) ， 代 价 是 每 一 百 万 个 未 测试 的 箱子 中 会 出 错 一 次 。 
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此 外 ， 通 过 改变 在 得 出 某 箱 芯片 合格 的 结论 之 前 所 测试 芯片 的 数量 ， 可 以 让 出 错 的 概率 尽 
可 能 小 到 让 我 们 满意 。 例 如 ， 如 果 让 测试 的 世上 户 数 翻番 ,达到 262 块 ,那么 失败 的 概率 就 成 了 之 
前 的 平方 了 ， 也 就 是 成 了 万 亿 分 之 一 ， 或 者 说 是 10 一 。 还 有 ， 我 们 能 以 更 高 的 失败 率 为 代价 节 
省 各 数 倍 的 时 间 。 例 如 ， 如 果 将 测试 的 芯片 数 减 半 ， 减 至 每 箱 测试 66 块 芯片 ， 那 么 失败 率 就 会 
达到 约 1000 箱 未 测试 芯片 中 就 有 一 箱 出 问题 。 


4.13.3 “习题 


(1) 377、383 和 391 哪 个 是 质数 ? 

(2) 假设 使 用 图 4-22 所 示 的 函数 查找 元 素 x， 不 过 在 项 ;处 找到 x 的 概率 与 ni 成 正比 。 也 就 是 说 ,设想 一 
个 具有 n(n+])/12 个 点 的 概率 空间 , 其 中 个 点 表示 x 在 AL01 的 情况 ，n 一 1 个 点 表示 x 在 A[1] 的 情况 ， 
以 此 类 推 ， 直 到 1 个 点 表示 x 在 Arn-1] 的 情况 。 该 算法 在 本 概率 空间 中 的 期 望 运行 时 间 是 多 少 ? 

(3) 1993 年 ， 美 国 职业 篮球 联赛 (NBA ) 设立 了 由 未 参加 季 后 赛 的 11 支 球 队 构 成 的 选秀 乐 透 区 。 战 绩 
最 差 的 球 队 拿 到 11 张 彩票 ,次 差 的 球 队 拿 到 10 张 ， 以 此 类 推 ， 直 到 第 11 差 的 球 队 拿 到 1 张 彩票 。 然 
后 随机 选 出 一 张 彩票 ， 并 将 第 一 位 选秀 权 奖 励 给 该 彩票 的 所 有 者 。 那 么 ， 被 选中 的 彩票 1 的 所 有 者 
排名 (从 底部 算 起 ) 的 函数 AD 的 期 望 值 是 多 少 ? 

(4) ** 继续 习题 (3) 中 描述 的 乐 透 机 制 。 中 签 的 球 队 会 失去 所 有 彩票 ,接着 会 选 出 代表 第 二 位 选秀 权 的 
彩票 。 而 此 次 中 签 队伍 剩 下 的 彩票 都 会 被 收回 ， 接 着 抽出 第 三 位 选秀 权 的 彩票 。 那 么 得 到 第 二 位 
和 第 三 位 选秀 权 的 队伍 排名 的 期 望 值 是 多 少 ? 

(5)* 假设 有 大 小 为 的 数组， 它 可 能 是 有 序 的 ， 也 可 能 是 随机 装 满 整 数 。 我 们 希望 能 构建 某 个 蒙特 卡 
洛 算法 ， 若 它 发 现 该 数组 是 无 序 时 就 说 “ 真 ”， 否 则 就 说 “我 不 知道 ”。 通 过 重复 这 种 测试 钦 ， 
我 们 很 想 知道 失败 的 概率 不 超过 2*。 给 出 这 样 的 算法 。 提 示 : 确保 测试 是 相互 独立 的 。 这 里 举 个 
测试 不 独立 的 例子 ， 我们 可 能 测试 是 否 有 A[0]<A[1] ， 并 测试 A[1]<A[2]。 这 两 项 测试 是 相互 
独立 的 。 然 而 ， 如 果 接 着 测试 A[0] <A[2] ， 该 测试 就 不 再 是 独立 的 了 ， 因 为 知道 前 两 个 关系 成 立 
的 话 就 能 肯定 第 三 个 关系 是 成 立 的 。 

(6) ** 假设 有 大 小 为 2， 且 存放 着 从 1 到 ”这 一 范围 内 整数 的 数组 。 这 些 整数 可 能 在 选 出 时 就 是 不 同 的 ， 
也 可 能 是 随机 独立 选 出 的 , 因此 数组 中 可 能 有 相等 的 项 。 给 出 运行 时 间 为 O(Vn) 的 蒙特 卡 洛 算法 ， 
而 且 该 算法 随机 装 和 人 的 数字 各 不 相同 的 概率 最 多 只 有 10“。 
































测试 整数 是 否 为 质数 


尽管 示例 4.45 不 是 个 真正 的 程序 ， 但 它 仍然 展示 了 一 种 实用 的 算法 原则 ， 而 且 其 实 是 衡量 产品 可 靠 
性 的 技术 的 一 种 真实 写照 。 一 些 有 趣 的 计算 机 算法 也 用 到 了 蒙特 卡 洛 算法 的 思路 。 

排 在 首位 的 大 概 是 测试 某 个 数字 是 否 为 质数 的 问题 。 这 一 问题 并 非 是 无 聊 的 数论 问题 。 事 实 表明 ， 
计算 机 安全 的 诸多 中 心思 想 都 涉及 知道 一 个 非常 大 的 数 为 质数 。 粗 略 地 讲 ， 当 使 用 具有 1 位 数字 的 质数 为 
言 息 加 密 时 ， 如 果 要 在 不 知道 密 钥 的 情况 下 解密 信息 ， 就 需要 从 几乎 所 有 10" 种 可 能 中 猜测 。 如 果 让 1 足 
够 大 ， 就 可 以 确保 “攻破 ”代码 要 么 需要 超 乎 寻常 的 运气 ， 要 么 需要 远 超 可 达 水 平 的 计算 时 间 。 

因此 ， 我 们 想 要 有 种 方式 来 测试 一 个 非常 大 的 数 是 否 为 质数 ， 并 希望 在 远 小 于 该 质数 的 值 的 时 间 内 
完成 测试 ， 理 想 状 态 下 ， 和 希望 测试 所 花 的 时 间 与 数字 的 位 数 成 比例 ， 即 与 数字 的 对 数 成 比例 。 检 测 合 数 
( 非 质数 ) 的 问题 似乎 并 不 难 。 全 如， 除 2 之 外 的 所 有 偶数 都 是 合 数 ， 所 以 看 起 来 已 经 解决 一 半 问 题 了 。 
同样 地 ， 那 些 能 被 3 整除 的 数 各 位 数字 之 和 要 能 被 3 整除 ， 所 以 可 以 编写 一 个 稍 慢 于 与 数字 位 数 存 在 线性 
关系 的 递归 算法 来 测试 某 数 能 否 被 3 整除 。 然 而 ， 对 很 多 数字 而 言 ， 这 个 问题 还 是 很 坏 手 。 例 如 ，377、 
383 和 391 中 有 一 个 是 质数 ， 是 哪 一 个 呢 ? 
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有 一 种 测试 合 数 的 蒙特 卡 洛 算 法 。 在 每 次 和 迭代 时 ， 它 至 少 有 1/2 的 概率 在 被 测试 的 数字 为 合 数 时 说 
“ 真 ”， 而 且 如 果 该 数字 为 质数 ， 它 绝对 不 说 “ 真 ”。 下 面 要 描述 的 并 非 确 切 的 算法 ， 不 过 除了 一 小 部 分 
合 数 外 ， 它 对 大 部 分 合 数 都 起 作用 。 完 整 的 算法 已 经 超出 本 书 要 讲 的 范围 了 。 

该 算法 的 依据 是 费 蕊 小 定理 ， 该 定理 是 说 ， 如 果 p 为 质数 ， 且 a 是 介 于 1 和 pl1 之 间 的 菜 个 整数 ， 屠 
么 当 q"! 除 以 p 时 ， 余 数 为 1。" 此 外 ， 除 了 小 部 分 “ 坏 ” 合 数 之 外 ， 如 果 a 是 在 1 到 p 一 1 之 间 的 整数 中 随机 
选 出 的 ， 那 么 qr?! 除 以 p 时 余数 不 是 1 的 概率 至 少 有 1/2。 例如 ,假设 p=7， 那 么 1*、2*、…、69 分 别 为 1、 
64、729、4096、15625 和 46656。 它 们 除 以 7 的 余数 全 是 1。 不 过， 如 果 p=6 ， 是 个 合 数 ， 那么 1 、25、…、 
25 分 别 等 于 1]、32、243、1024 和 3125， 它 们 除 以 6 的 余数 分 别 是 1、2、3、4、5。 只 有 20% 是 1。 

因此 ， 这 种 测试 菜 数 字 p 是 否 为 质数 的 “算法 ”要 从 1 到 p 一 1 中 独立 且 随 机 地 选 出 kK 个 整数 。 如 果 对 
任何 选 出 的 a 来 说 ， 都 有 a? 1/p 的 余数 不 是 1， 就 说 p 为 合 数 ， 否 则 说 它 是 质数 。 如 果 没 遇 到 “ 坏 ” 合 数 ， 
就 可 以 说 失败 的 概率 至 多 为 2*，, 因为 对 某 个 给 定 的 4 而 言 , 合 数 满足 测试 的 概率 至 少 为 1/2。 如果 让 A 为 40， 
那么 只 有 万 亿 分 之 一 的 概率 将 某 个 合 数 当成 质数 。 不 过 ， 若 是 要 处 理 那 些 “ 坏 ” 合 数 ， 就 需要 更 复杂 的 
测试 。 该 测试 仍然 是 p 的 位 数 的 多 项 式 ， 就 像 上 述 简 单 测试 那样 。 
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大 家 应 该 记 住 以 下 与 计数 相关 的 公式 和 范例 。 

D 将 k 个 值 分 配给 个 对 象 的 方法 共有 种。 范例 问题 是 粉刷 n 所 房屋 ， 其 中 每 所 房屋 可 从 
种 颜色 中 任 选 其 一 。 

D 排列 n 个 不 同 的 项 共有 nn 种 不 同方 式 。 

D 从 项 中 选 出 mt， 并 为 选 出 的 三 排序 ， 共 有 nl(n 一 甩 ! 种 不 同 的 方式 。 范 例 问题 是 为 及 
匹 赛马 参加 的 比赛 排 定 冠 亚 季军 (k=3 )。 


口 从 n 个 对 象 中 选 出 m 个 ,不 考虑 顺序 ， 有 | | 下 者 说 (ml) 种 方式 。 范 例 问 题 是 


n 
m 
扑克 有 牌 型 问题 ,其 中 n=52，m=5。 

口 如 果 想 排列 其 中 存在 相同 项 的 n 个 项 ， 可 以 按照 如 下 方式 计算 排列 方法 数 。 首 先 有 n!。 然 
后 ， 如 果 某 个 值 在 这 x 项 中 出 现 上 六 1 次 ， 就 除 以 局 。 对 每 个 出 现 超过 1 次 的 值 都 进行 该 除 
法 处 理 。 范 例 问题 是 计算 "个 字母 组 成 的 单词 的 构 词 方式 ， 其 中 必须 在 由 的 基础 上 为 单词 
中 每 个 出 现 次 数 达 !1 的 字母 除 以 Kl。 


口 如 果 要 将 z 个 相同 的 对 象 放 入 mm 个 容 需 , 共 | 


口 如 果 要 将 n 个 对 象 放 入 m 个 容器 ， 而 其 中 有 一 些 对 象 是 不 同 的 ,那么 要 依照 以 下 方式 计算 
分 装 方法 数 。 首 先 有 (n+m 一 1 (m 一 1)!。 然 后 ， 如 果 有 一 组 有 kk 个 相同 对 象 ， 而 且 过 1 ， 
就 除 以 已。 对 每 个 出 现 次 数 超过 1 次 的 值 都 执行 该 除法 处 理 。 范 例 问题 是 将 知 干 种 水 果 分 
给 孩子 们 。 

除 此 之 外 ， 大 家 还 应 该 记 住 有 关 概 率 的 如 下 要 点 。 





nt+m—l 


m 


| 种 方式 。 范 例 问 题 是 给 孩子 分 笠 果 。 














GD 费 马 小 定理 的 确切 表述 为 ， 若 pz 为 质数 ， 且 ac 和 p 互 质 ， 则 当 oz: 除 以 pz 时， 余数 恒 为 1。 
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口 概率 空间 由 点 组 成 ， 其 中 每 个 点 都 是 某 个 实验 的 结果 。 每 个 点 x 都 与 一 个 被 称 为 x 的 概率 
的 非 负 实数 相关 联 。 某 个 概率 空间 中 各 点 概率 之 和 是 1。 

口 事件 是 概率 空间 中 的 点 的 子 集 ， 事 件 的 概率 是 事件 中 各 点 概率 之 和 。 任 一 事件 的 概率 都 
是 在 0 到 1 之 间 的 。 

口 如 果 所 有 点 都 是 等 可 能 的 ， 那 么 事件 E 条 件 下 事件 F 的 条 件 概 率 就 是 事件 E 中 也 在 事件 FF 
中 的 点 所 占 的 比例 。 

口 如 果 事 件 F 条 件 下 事件 E 的 条 件 概 率 与 事件 E 本 身 的 概率 相等 ,就 表示 事件 EB 是 独立 于 事件 
FF 的。 如 果 事 件 E 是 独立 于 事件 PF 的， 那么 事件 F 也 是 独立 于 事件 的 。 

口 求 和 规则 表明 ,事件 BE 和 Fr 中 有 一 个 发 生 的 概率 ， 至 少 是 两 者 概率 中 的 较 大 者 ， 而 且 不 会 
大 于 两 者 概率 之 和 ( 如果 该 和 大 于 1， 则 是 不 大 于 1 )。 

口 乘积 规则 表明 , 某 项 实验 的 结果 既 在 事件 E 中 又 在 事件 中 的 概率 不 大 于 己 和 天 一 者 概率 中 
的 较 小 者 ， 并 至 少 是 两 者 概率 之 和 减 去 1 ( 或 者 如 果 说 该 值 为 负 ， 则 是 至 少 为 0 )。 

口 最 后 ， 要 讲 一 些 本 曹 所 介绍 的 原则 在 计算 机 科学 领域 的 应 用 。 

口 对 于 能 处 理 具有 “小 于 ”关系 的 任意 类 型 数据 的 排序 算法 , 在 为 ?个 项 排序 时 都 至 少 需要 
与 nlogn 成 正比 的 时 间 。 

口 长 度 为 n 的 位 串 共 有 2" 个 。 

口 随机 数 生 成 器 是 生成 看 似 独 立 实 验 结果 的 数字 序列 的 程序 ， 虽 然 这 些 数字 其 实 完全 是 由 
该 程序 确定 的 。 

口 概率 推理 系统 需要 一 种 方式 表示 由 硅 干 事件 形成 的 复合 事件 的 概率 。 求 和 规则 和 乘积 法 
则 有 时 能 帮 上 忙 。 我 们 还 了 解 了 其 他 一 些 为 复合 事件 的 概率 设 定 边界 的 简化 假设 。 

口 蒙特 卡 洛 算法 使 用 随机 的 数字 生成 期 望 的 结果 (“ 真 ”) 或 者 完全 不 生成 结果 。 通 常 重复 
该 算法 固定 次 , 如 果 没 有 哪 次 重复 过 程 生 成 答案 “ 真 ”, 就 可 以 得 出 答案 为 “ 假 ” 的 结论 ， 
从 而 解决 手头 的 问题 。 通 过 对 重复 的 次 数 加 以 选择 ， 可 以 将 错误 得 出 结果 为 “ 假 ”的 概 
率 调整 到 低 得 令 自 己 满 意 ， 但 不 能 将 出 错 的 概率 降 到 0。 
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在 很 多 情况 下 ， 信 息 会 具有 家 谱 或 组 织 图 中 那样 的 分 层 结构 或 衣 套 结构 。 为 分 层 结构 建 模 
的 抽象 被 称 为 树 ， 而 且 这 种 数据 结构 是 计算 机 科学 领域 中 最 为 基础 的 内 容 之 一 。 它 是 包括 Lisp 
在 内 的 数 种 程序 设计 语言 的 底层 模型 。 

本 书 很 多 章节 中 介绍 了 不 同类 型 的 树 。 例 如 ,在 1.3 节 中 ,我 们 看 到 一 些 计算 机 系统 中 的 目 
录 和 文件 是 如 何 被 组 织 成 树 形 结构 的 。2.8 节 中 ， 我 们 利用 树 展示 了 如 何 递归 地 分 割 表 ， 并 在 归 
并 排序 算法 中 将 其 重组 。3.7 节 中 ， 我 们 用 树 说 明了 程序 中 的 简单 语句 是 如 何 一 步 步 组 合成 更 为 
复杂 的 语句 的 。 


5.1 本 章 主 要 内 容 


本 章 讨论 的 主要 内 容 如 下 。 

口 与 树 相 关 的 术语 和 概念 (5.2 节 )。 

口 用 于 在 程序 中 表示 树 的 基础 数据 结构 (5.3 节 )。 

口 对 树 中 节点 进行 操作 的 递归 算法 (5.4 节 )。 

口 结构 归纳 法 一 一 对 树 进 行 归纳 证 明 的 方法 ， 在 这 种 归纳 中 要 用 小 树 逐 渐 构 建成 更 大 的 树 
(5.5 节 )。 

口 二 又 树 ， 树 的 一 种 变种 ， 每 个 节点 都 只 有 两 个 子 树 (3.6 节 )。 

口 二 又 查 找 树 ， 维 护 一 组 要 进行 插入 和 删除 操作 的 元 素 的 数据 结构 ( 5.7 节 和 5.8 节 )。 

口 优先 级 队列 是 一 个 可 以 向 其 中 添加 元 素 的 集合 ， 不 过 每 次 只 能 从 中 删除 最 大 的 元 素 。 偏 
序 树 ( partially ordered tree ) 是 为 了 实现 优先 级 队列 而 引入 的 一 种 高 效 数据 结构 ， 而 利用 
被 称 为 “ 堆 ” 的 平衡 偏 序 树 数 据 结 构 得 到 的 堆 排 序 算法 , 在 为 n 个 元 素 排序 时 所 花 的 时 间 
为 O(nlogn)。 


5.2 基本 术语 


树 是 被 称 为 节点 的 点 与 被 称 为 边 的 线 的 集合 。 一 条 边 连 接着 两 个 不 同 的 节点 ， 要 形成 树 ， 
这 一 系列 的 节点 和 边 必 须 满足 某 些 属性 ， 图 5-1 就 是 树 的 示例 。 

(1) 在 树 中 ， 有 一 个 节点 是 与 众 不 同 的 ， 它 被 称 为 根 。 树 的 根 通常 画 在 其 顶端 。 在 图 5-1 中 ， 
根 为 n1。 
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(2) 除根 之 外 的 每 个 节点 c 都 由 一 条 边 连接 到 某 个 称 为 c 的 父 节点 的 节点 p。 我 们 也 将 节点 c 称 
为 p 的 子 节点 。 节点 的 父 厄 点 要 男 在 该 扩 点 的 上 方 。 例 如 ， 在 图 5-1 中 ,nn 就 是 ns、n3 和 ns 的 父 节 


碟 ， 而 mp 是 ns 和 和 ne 的 父 节点 。 换个 角度 讲 ， N27、 n3 和 ns 都 是 1 的 子 市 点 ， 而 ns 和 ne 是 ny 的 子 方 点 。 
(3) 如 果 从 除根 之 外 的 任 一 市 点 a 开始， 移动 到 n 的 父 节 点 ， 再 到 n 的 父 节 点 的 父 节 点 ， 以 此 


类 推 , 最 终 到 达 树 的 根 节 点 ， 就 说 树 是 连通 的 。 例 如 ， 从 ny 开始 ， 移 动 到 它 的 父 方 点 my， 然后 
移动 到 由 的 父 节 点 ， 也 驶 是 根 节 点 mm。 


图 5-1 有 7 个 节点 的 树 


5.2.1 树 的 等 价 递 归 定 义 


利用 由 较 小 树 构成 较 大 树 的 归纳 定义 ， 还 可 以 递归 地 定义 树 。 

依据 。 单 个 证 点 就 是 一 棵 树 ， 我 们 说 a 就 是 这 棵 单 季 点 树 的 根 。 

归纳 。 设 r 是 一 个 新 三 点 ， 并 设 TI、T,、…、Ti 分 别 是 根 为 c1、c，、…、ct 的 树 。 这 里 要 求 任何 
节点 在 T 中 的 出 现 次 数 都 不 会 超过 一 次 ， 而 且 r 是 个 “新 ”市 点 ,一 定 不 会 在 这 些 树 中 出 现 。 可 
以 按照 以 下 规则 用 r 和 天、、…、T 组 成 新 的 树 7。 

(a) 用 x 作为 树 7 的 根 。 

(b) 从 7 添加 连接 到 cl、c、…、ck 的 边 ， 使 得 这 些 节 点 都 成 为 根 节 点 7 的 子 节 点 。 还 可 以 将 本 
步 又 视 为 让 rz 成 为 TI、T2、…、Ti 些 树 的 根 节点 的 父 节 点 。 


+ 示例 5.1 

我 们 可 以 使 用 这 一 递归 定义 构建 图 5-1 中 的 树 ， 而 这 一 构建 过 程 也 验证 了 图 5-1 中 的 结构 为 
树 。 根 据 依据 规则 ， 单 个 节点 可 被 视 为 树 ， 所 以 节点 ns 和 ne 本 身 都 是 树 。 接 着 ， 可 以 利用 归纳 规 
则 创建 新 树 ， 其 中 ,作为 根 节点 xr, 而 节点 ns 就 是 树 TI， 节 点 ne 则 是 树 乃 ,它们 是 x 这 一 新 根 节点 的 
子 节 点 。 节 点 c1 和 ec; 分别 是 ns 和 ne， 因 为 它们 就 是 树 TI 和 的 根 。 这 样 一 来 ,我 们 就 得 出 如 下 结构 





是 树 的 结论 ， 而 且 它 的 根 是 n,。 
同样 ， 根 据 依据 ny 就 是 一 棵 树 ， 而 且 根 据 归纳 规则 ， 如 下 结构 
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是 一 棵 树 ， 其 中 是 它 的 根 。 
节点 与 本 身 也 是 一 棵 树 。 最 后 ， 如 果 将 节点 三 作为 r， 并 将 关 、m 和 ma 视 作 刚 提 到 的 3 柠 树 的 
根 ， 就 能 创建 出 图 5-1 中 的 结构 ， 并 验证 它 确实 是 棵 树 。 


5.2.2 路径、 祖先 和 子孙 


这 种 父子 关系 可 以 自然 而 然 地 扩展 为 祖先 和 子孙 的 关系 。 粗 略 地 讲 ， 龙 点 的 祖先 就 是 从 市 
点 到 其 父 节 点 ， 再 到 其 父 节 点 的 父 节 点 ， 以 此 类 推 ,， 顺 着 这 样 一 条 唯一 路 径 找到 的 那些 市 点 。 
严格 地 讲 ， 节 点 本 里 也 是 其 自身 的 祖先 方 点 。 而 子孙 关系 则 是 祖先 关系 的 反 向 关系 ， 像 父子 关 
系 这 样 就 是 互 为 反 辐 关系 。 也 就 是 说 ， 当 且 仅 当 贡 点 4 为 节点 d 的 祖先 节点 时 ， 节 点 d 才 是 节 点 a 
的 子孙 市 点 。 














更 严谨 地 讲 ， 假 设 mi、m2;、…、mx 是 树 中 的 一 系列 节点 ， 其 中 训 是 my 的 父 节 点 ，mwy 是 m3 
的 父 节点 ， 以 此 类 推 ， 直 到 mi 是 mi 的 父 节 点 。 那 么 mi、m2、…、mix 就 是 该 树 中 从 mi 到 mx 的 一 


条 路 径 。 路 径 的 长 度 为 -1 ， 比 路 径 上 的 节点 数 小 1。 请 注意 ， 路 径 可 能 是 由 单个 节点 构成 的 ， 
这 种 情况 下 路 径 的 长 度 就 为 0。 


+ 示例 5.2 

在 图 5-1 中 ,站 、7zP2、16 是 从 根 节 点 矿 到 节点 6 的 一 条 长 度 为 2 的 路 径 ， 记 是 从 六 到 它 目 己 的 
一 条 长 度 为 0 的 路 径 。 

如 果 mi、 1112、“” mi 是 树 中 的 一 条 路 径 ， 厄 点 mi 就 是 m4 的 祖先 ， 而 节点 mx 则 是 mw 的 子孙 。 
如 果 该 路 径 的 长 度 不 小 于 1， 那 么 mi 就 是 mx 的 真 祖先 ， 而 mx 则 是 m1 的 真子 孙 。 还 要 记 住 ， 路 和 欠 
长 度 可 能 为 0， 在 这 种 情况 下 ， 我 们 就 可 以 得 出 ml 是 其 自身 的 祖先 也 是 其 自 喘 的 子孙 这 一 结论 ， 
虽然 它 不 是 目 己 的 真 祖先 或 真子 孙 。 树 的 根 节点 是 树 中 每 个 节点 的 祖先 ， 而 树 中 每 个 节点 都 是 
根 市 点 的 子孙 。 


+ 示例 5.3 

在 图 5-1 中 ,7 个 厄 点 全 都 是 m1 的 子孙 ， 而 m1 是 所 有 市 点 的 和 祖先。 此外， 除 加 之 外 的 所 有 市 点 
都 是 n1 的 真子 办， 而 m1 也 是 除了 它 目 己 之 外 的 所 有 方 点 的 真 祖先 。ns、nw5p 和 nn 都 是 ns 的 祖先 。 而 
na 的 子孙 有 na 和 和 ny。 

有 具有 相同 父 节 点 的 广 点 有 时 也 称 为 兄弟 节点 。 例 如 ， 在 图 5-1 中 ，n，、n3 和 14 就 互 为 兄 第 方 
所 ， 而 ns 和 和 ne 互 为 兄弟 季 点 。 


























5.2.3 子 树 
在 树 7 中 ， 某 个 节点 a， 与 其 所 有 真子 孙 ( 车 存 在 的 话 )， 就 构成 了 7 的 子 树 。 而 节点 n 就 是 
该 子 树 的 根 节点 。 请 注意 , 子 树 要 满足 3 个 条 件 才 能 构成 树 : 它 有 根 节点 ; 子 树 中 其 他 节点 在 该 


子 树 中 都 有 唯一 的 父 节点 ;此 外 ， 沿 着 该 子 树 中 任意 节点 的 父 节 点 回 湖 ， 最 终 都 能 达到 该 子 树 
的 根 节点 。 


+ 示例 5.4 

再 来 看 图 5-1， 节 点 自己 就 是 棵 子 树 ， 因 为 除了 它 自 己 之 外 没有 别 的 子孙 。 而 节点 n。、 
ns 和 ne 也 构成 了 一 棵 子 树 ， 因 为 这 些 节点 都 是 ,的 子孙 。 不 过 ， 在 没有 节点 ns 的 情况 下 ，ns 和 n6 
两 个 节点 本 身 是 不 能 构成 子 树 的 。 最 后 , 图 5-1 中 的 整 棵 树 都 是 它 自己 的 子 树 , 其 中 根 节点 为 n1。 
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5.2.4 ”叶子 市 点 和 内 部 市 点 


树 中 没有 子 节点 的 节点 就 是 叶子 节点 。 内 部 节点 是 指 至 少 有 一 个 子 节 点 的 节点 。 因 此 ， 树 
中 的 每 个 节点 要 么 是 叶子 节点 ， 要 么 是 内 部 节点 ， 但 不 可 能 同时 是 这 两 者 。 树 的 根 节点 通常 是 








内 部 节点 ， 不 过 ， 如 果 该 树 只 由 一 个 节点 组 成 ， 那 么 该 节点 就 既是 根 节点 也 是 叶子 节点 。 
+ 示例 5.5 
在 图 5-1 中 ， ns、 Ne、 713 和 7 都 是 时 子 节 点 ， 而 nj、 区 入 则 是 内 部 节点 。 


5.2.5 ”高 度 和 深度 
在 树 中 ， 节 点 2 的 高 度 是 指 从 2 到 叶子 节点 最 长 路 径 的 长 度 ， 树 的 高 度 就 是 根 节点 的 高 度 。 
而 节点 7 的 深度 ， 或 者 说 等 级 (level )， 就 是 从 根 节 点 到 z 的 路 径 的 长 度 。 


+ 示例 5.6 
在 图 5-1 中 ， 节 点 n1 的 高 度 为 2，n; 的 高 度 为 1， 而 叶子 节点 ;的 高 度 为 0。 其 实 ， 任意 叶子 节 
点 的 高 度 都 为 0。 图 5-1 中 ， 树 的 高 度 为 2。 节 点 m1 的 深度 为 0，ns 的 深度 为 1，ns 的 深度 为 2。 


5.2.6 ”有 序 树 


男 外 ， 可 以 为 任意 节点 的 子 节 点 指定 从 左 到 右 的 顺序 。 例 如 ， 图 5-1 中 ni 的 子 入 点 最 左边 是 
n>， 然 后 是 n3， 再 然后 是 na。 这 一 从 左 到 右 的 排列 方式 可 以 扩展 到 为 树 中 的 所 有 市 点 排列 顺序 。 
如 有 果 m 和 nn 是 兄弟 节点 ， 而 m 在 n 的 左边 ， 那 么 m 的 子孙 全 部 在 n 的 子孙 的 左边 。 


+ 示例 5.7 

在 图 5-1 中 ， 根 为 ns 的 子 树 中 所 有 节点 (也 就 是 a,、ns 和 ne ) 都 在 根 为 n3 和 nn 的 子 树 所 有 市 点 
的 左边 。 因 此 ，n;、 芭 和 ne 都 在 n3、n 和 nj 的 左边 。 

在 树 中 选择 任意 两 个 互 不 存在 祖先 关系 的 节点 x 和 y。 由 于 有 着 “在 左边 ”的 定义 ，x 和 和 y 中 
其 中 有 一 个 是 在 男 一 个 的 左边 。 要 分 辨 哪个 在 哪个 左边 ， 就 要 从 x 和 y 开 始 沿 着 路 径 问 根 市 点 回 
溯 。 而 在 某 一 点 ， 可 能 是 根 节 点 ， 也 可 能 是 较 低 的 点 ， 这 两 条 路 径 会 在 某 个 如 图 $-2 所 示 的 节点 
z 相 遇 。 从 x 和 y 到 z 的 路 径 分 别 要 经 过 两 个 不 同 的 市 点 m 和 n， 可 能 有 m=x 且 (或) n=y, 但 一 
定 有 mn ， 否 则 这 两 条 路 径 在 z 以 下 的 某 个 位 置 就 融合 了 。 





























© © 


图 5-2 市 点 x 在 市 点 y 的 左边 
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假设 m 在 n 的 左边 。 那么 因为 x 在 根 为 m 的 子 树 中 , 而 y 在 根 为 x 的 子 树 中 , 所 以 有 x 在 y 的 左边 。 
同样 ， 如 有 果 m 在 n 的 右边 ， 那 么 x 也 就 在 y 的 右边 。 


+ 示例 5.8 
因为 叶子 节点 不 可 能 是 其 他 叶子 节点 的 子孙 节点 ， 所 以 所 有 叶子 节点 的 顺序 都 遵循 “从 左 
起 ”的 原则 。 例 如 ， 图 5-1 中 所 有 叶子 节点 的 顺序 是 ns、ne、n3、n7。 


5.2.7 标号 树 


标号 树 ( labelled tree ) 是 指 树 中 每 个 节点 都 有 与 之 关联 的 标号 或 值 的 树 。 我 们 可 将 标号 视 
为 与 给 定 节 点 相关 联 的 信息 。 标 号 可 以 是 很 简单 的 内 容 ， 比 如 一 个 整数 ; 也 可 以 是 复杂 的 内 容 ， 
比如 整个 文档 中 的 文本 。 我 们 可 以 改变 节点 的 标号 ， 但 不 能 改变 节点 的 名 称 。 

如 果 节 点 的 名 称 不 重要 ， 就 可 以 用 节点 的 标号 来 表示 它 。 不 过 ， 标 号 并 不 总 是 能 为 节点 提 
供 唯 一 名 称 ， 因 为 在 干 个 节点 可 能 有 着 同一 标号 。 因 此 ， 很 多 时 候 在 绘制 节点 时 既 会 标 上 其 标 
号 ， 也 会 标 上 其 名 称 。 下 面 的 一 些 图 展示 了 标号 树 的 概念 ， 并 提供 了 一 些 示 例 。 


5.2.8 ”表达 式 树 一 一 一 类 重要 的 树 

算术 表达 式 可 以 用 标号 树 表示 ， 而 且 将 表达 式 直 观 表 示 为 树 往往 是 非常 有 意义 的 。 其 实 ， 
表达 式 树 ( expression tree ) 顾名思义 就 是 以 统一 的 方式 指定 了 表达 式 的 操作 数 与 操作 符 之 间 的 关 
联 , 不 论 这 种 关联 是 表达 式 中 括号 的 放置 需要 的 ,还 是 所 涉及 运算 符 的 优先 级 和 结合 规则 需要 的 。 

回想 一 下 2.6 节 中 对 表达 式 的 讨论 ， 特 别 是 示例 2.17， 我 们 在 该 例 中 给 出 了 涉及 和 常见 算术 运 
算 符 的 表达 式 的 递归 定义 。 通 过 对 表达 式 递归 定义 的 模拟 ， 就 可 以 递归 地 定义 对 应 的 标号 树 。 
大 致 的 概念 就 是 通过 将 运算 符 应 用 到 较 小 表达 式 上 以 构成 更 大 的 表达 式 ， 我 们 会 创建 标号 为 该 
运算 符 的 新 节点 。 该 新 节点 就 成 为 了 表示 较 大 表达 式 的 树 的 根 节 点 ， 而 它 的 子 节 点 就 是 表示 较 
小 表达 式 的 树 的 根 节 点 。 

例如 ， 可 以 按照 如 下 方式 ， 定 义 表示 使 用 二 元 运算 符 +、-、x 、/ 及 一 元 运算 符 - 的 算术 表 
达 式 的 标号 树 。 

依据 。 单 个 原子 操作 数 ( 比如 一 个 变量 、 一 个 整数 或 一 个 实数 ， 如 2.6 市 介绍 的 ) 是 表达 式 ， 
它 的 树 就 是 标号 为 该 操作 数 的 一 个 节点 。 


za 
人 人 入 人 人 


(a) (E+E,) (b) (2) 









































图 5-3” (B+ 妃 ) 和 -5 的 表达 式 树 
归纳 。 如 果 忆 和 羽 这 两 个 表达 式 分 别 是 由 树 九 和 甩 表 示 的 , 那么 表达 式 (B1+Ey) 就 是 由 图 5-3a 


所 示 的 树 表示 的 ， 其 根 节 点 标号 为 +。 该 根 节点 有 两 个 子 节 点 ， 依 次 分 别 是 树 九 和 胞 的 根 节 点 。 
同样 ， 表 达 式 (B21-B)、(B1 x 瑟 ) 和 (CEVE2) 分 别 有 着 根 节 点 标号 -、x 和 /， 且 子 树 均 为 TI 和 乃 的 表 
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达 式 树 。 最 后 ， 可 以 将 一 元 减 号 运算 符 应 用 到 表达 式 B1 上 。 这 里 引入 了 标号 为 -的 根 节 点 ,而 其 
唯一 的 子 节点 是 的 根 节点 ， 表 示 (-B1) 的 树 如 图 5-3b 所 示 。 


+ 示例 5.9 
在 示例 2.17 中 ， 我 们 按照 依据 和 递归 规则 对 一 系列 6 个 表达 式 的 递归 构建 进行 过 讨论 。 图 
2-16 列 出 过 的 这 些 表 达 式 分 别 是 : 


QO) x (iv) (-(x 年 10)) 
Gi) 10 RE 
(ii) Cer10) CD (yx(-(x+10))) 


表达 式 (i)、( 闻 和 (Vv) 都 是 单个 操作 数 ， 因 此 依据 规则 就 说 明了 图 5-4a、 图 5-4b、 图 5-4e 中 的 
树 分 别 是 表示 这 些 表达 式 的 。 请 注意 ， 这 些 树 都 是 由 一 个 节点 组 成 的 ， 节 点 的 名 称 分 别 为 ni、 
和 和 ns， 而 节点 的 标号 则 是 圆圈 中 的 操作 数 。 


(cn (10) nn, 


(a) 表示 x (b) 表示 10 





(d) 表示 (x+10)) (6) 表示 y (D 表示 (yx(-(x+10))) 
图 5-4 ”表达 式 树 的 构建 
表达 式 (iii) 是 对 操作 数 x 和 10 应 用 操作 符 + 得 到 的 , 所 以 可 以 看 到 图 5-4c 所 示 的 表示 该 表达 式 
的 树 根 节点 标号 为 +， 而 图 5-4a 和 5-4b 中 树 的 根 节点 则 作为 其 子 节 点 。 表 达 式 (iv) 是 对 表达 式 (iii) 
应 用 一 元 的 -， 所 以 图 5-4d 中 表示 (-(x+10)) 的 树 在 表示 (x+10) 的 树 的 基础 之 上 ， 多 了 标号 为 - 
的 根 节点 。 最 后 ， 图 5-4f 所 示 的 是 表示 表达 式 (yx(-(x+10))) 的 树 ， 其 根 节点 标号 为 x ， 且 其 
子 节点 依次 为 图 5-4e 和 5-4d 所 示 树 的 根 节 点 。 


5.2.9 习题 


(1) 在 图 5-5 中 有 一 棵 树 ， 分 别 指出 如 下 内 容 描述 的 各 是 什么 。 
(a) 该 树 的 根 节 点 。 
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(b) 该 树 的 叶子 节点 。 
(c) 该 树 的 内 部 节点 。 
(d) 市 点 6 的 兄弟 节点 。 
(e) 以 节点 $ 为 根 节 点 的 子 树 。 
(f) 节点 10 的 祖先 。 
(g) 节点 10 的 子孙 。 
(h) 节点 10 左 边 的 节点 。 
人 节点 10 右 边 的 节点 。 
0) 该 树 中 的 最 长 路 径 。 
(k) 节点 3 的 高 度 。 

(1) 节点 13 的 深度 。 
(m) 该 树 的 高 度 。 





图 5-5 ”习题 (1) 的 树 


(2) 树 中 的 叶子 节点 能 否 有 (a) 子 孙 ; (pb) 真 子孙 ? 

(3) 证 明 : 在 树 中 ， 任 何 叶子 节点 都 不 可 能 是 其 他 叶子 节点 的 祖先 。 

(4) *# 证 明 : 本 节 中 树 的 两 种 定义 是 等 价 的 。 提 示 : 要 证 明 由 非 递 归 定 义 生成 的 树 就 是 根据 递归 定义 生成 
的 树 ， 就 要 利用 到 对 树 中 节点 数 的 归纳 。 在 相反 的 方向 上 ， 要 利用 对 递归 定义 中 递归 轮 数 的 归纳 。 

(3) 假设 有 由 4 个 节点 r-、a、b 和 c 组 成 的 图 。 节 点 r 是 个 扳 立 的 点 ， 没 有 边 连 通 它 。 其 余 3 个 节点 构成 了 
一 个 循环 ， 也 就 是 说 ， 有 一 条 边 连通 aq 和 b5， 有 一 条 边 连通 Pp 和 c， 还 有 一 条 边 连通 c 和 a。 为 何 该 图 
不 是 树 ? 

(6) 在 很 多 种 树 中 ， 在 内 部 节点 和 叶子 节点 (确切 地 说 是 这 两 种 节点 的 标号 ) 之 间 有 着 明显 的 区 别 。 
例如 ， 在 表达 式 树 中 ， 内 部 节点 表示 运算 符 ， 而 叶子 节点 表示 原子 操作 数 。 给 出 以 下 各 种 树 的 内 
部 节点 和 叶子 节点 间 的 区 别 。 

(a) 如 1.3 节 中 所 述 ， 表 示 目 录 结 构 的 树 。 
(b) 如 2.8 节 中 所 述 ， 表 示 归 并 排序 中 表 的 分 割 和 合并 的 树 。 
(c) 如 3.7 节 中 所 述 ， 表 示 函 数 的 结构 的 树 。 

(7) 给 出 表示 以 下 表达 式 的 表达 式 树 。 请 注意 ， 出 于 习惯 性 的 表达 ， 题目 中 的 表达 式 省 略 了 多 余 的 括 

号 ， 大 家 首先 必须 利用 运算 符 的 优先 级 和 结合 性 恢复 适当 的 括号 。 
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(a) (x+1)x(x—y+4) 

(b) 1+2+3+4+5+6 

(c) 9x8+7x6+5 

(8) 证 明 : 如 果 x 和 7 是 有 序 树 中 两 个 不 同 的 节点 ， 那 么 以 下 条 件 中 一 定 刚好 有 一 个 是 成 立 的 。 

(a) x 是 y 的 真 祖先 。 

(b) x 是 y 的 真子 孙 。 

(c) x 在 y 的 左边 。 

(gd x 在 y 的 右边 。 


5.3 树 的 数据 结构 


很 多 数据 结构 可 用 来 表示 树 。 应 该 选用 哪 种 数据 结构 ， 取 决 于 想 要 执行 的 特定 操作 。 举 个 
简单 的 例子 ， 如 果 想 要 做 的 只 是 定位 节点 的 父 节 点 ， 那 么 可 以 用 由 标号 组 成 的 结构 体 ， 加 上 指 
向 表示 节点 之 父 节 点 的 结构 体 的 指针 来 表示 每 个 节点 。 

作为 一 般 规则 ， 树 的 节点 可 以 用 结构 体 表 示 ， 这 些 结构 体 中 的 字段 以 某 种 方式 将 节点 链接 
在 一 起 ， 这 种 链接 方式 与 节点 在 抽象 的 树 中 的 连接 方式 类 似 ， 而 树 本 身 则 可 由 指向 表示 根 节 点 
的 结构 体 的 指针 来 表示 。 因 此 ， 在 谈 到 对 树 的 表示 时 ， 我 们 主要 是 对 节点 的 表示 方式 感 兴趣 。 

表示 方式 的 一 种 差异 体现 在 表示 节点 的 结构 体 在 计算 机 内 存 中 的 位 置 上 。 在 C 语 言 中 ， 可 
以 使 用 标准 库 stdlib.h 中 的 malloc 函 数 为 表示 节点 的 结构 体 创建 空间 , 这 种 情况 下 ,节点 都 “ 漂 
泊 ” 在 内 存 中 ， 并 只 能 通过 指针 来 访问 。 此 外 ， 可 以 创建 由 结构 体 组 成 的 数组 ， 并 用 数组 中 的 
元 素来 表示 节点 。 这 里 节点 还 是 根据 它们 在 树 中 的 位 置 链 接 起 来 的 ， 不 过 也 可 以 沿 着 数组 的 顺 
序 来 访问 这 些 节 上 点。 因此， 可 以 不 沿 着 树 中 的 路 径 来 访问 节点 。 基 于 数组 的 表示 方式 的 束 端 ， 
在 于 没 办 法 创建 一 棵 节点 数 超过 数组 所 含 元 素数 量 的 树 。 接 着 ， 我 们 会 假设 这 些 节 点 都 是 由 
malloc 创 建 的 ,虽然 在 树 的 大 小 有 限制 的 情况 下 , 由 相同 类 型 的 结构 体 组 成 数组 是 可 行 的 ,而 
且 有 可 能 是 首选 方案 。 

5.3.1 树 的 指针 数组 表示 

表示 树 的 最 简单 方式 之 一 就 是 为 每 个 节点 使 用 一 个 由 表示 节点 标号 的 字段 组 成 的 结构 体 ， 

后 面 再 跟 上 指向 该 节点 子 节点 的 指针 组 成 的 数组 。 图 5-6 就 表示 了 这 样 的 结构 。 常 量 bp/ 是 该 指针 


数组 的 大 小 ， 它 表示 节点 可 以 具有 的 最 大 子 节 点 数 ， 这 个 量 就 是 分 支 系数 (branching factor )。 
某 节 点 对 应 数组 的 第 i 个 位 置 含 有 指向 该 节点 第 i 个 子 节 点 的 指针 ， 不 存在 的 子 节 点 可 用 NULL 指 


针 表 示 。 
nl 


图 5-6 ”用 指针 数组 表示 的 节点 
在 C 语 言 中 ， 该 数据 结构 可 以 用 如 下 类 型 声明 来 表示 。 


typedef struct NODE *pNODE; 
struct NODE { 

int info; 

PNODE children [BF]; 









































}; 
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在 这 里 ， 字 段 info 表 示 构 成 节点 标号 的 信息 ， 而 BF 则 表示 分 文系 数 的 常量 。 在 本 章 中 我 
们 还 将 看 到 该 声明 的 多 个 变种 。 

在 这 种 表示 树 的 数据 结构 和 多 数 表 示 树 的 数据 结构 中 ， 都 将 树 表示 为 指向 根 节点 的 指针 。 
因此 ，pNODE 还 是 树 的 类 型 。 其 实 ， 可 以 在 bpNODE 的 位 置 使 用 类 型 TREE， 而 且 在 5.6 节 开始 介 
绍 二 又 树 时 ， 我 们 将 采纳 这 一 约定 。 不 过 ， 现 在 还 是 要 使 用 pNODE 这 个 名 称 代 表 “ 指 向 节点 的 
指针 ”类 型 ， 因 为 在 某 些 数据 结构 中 ， 指 向 节点 的 指针 除了 表示 树 之 外 还 用 于 其 他 用 途 。 

指针 数组 表示 使 我 们 能 在 00) 的 时 间 内 访问 任意 节点 的 第 i 个 子 节点 。 然 而 ， 当 树 中 上 只 有 少 
量 节点 有 很 多 子 节 点 时 , 这 种 表示 会 非常 浪费 空间 ,在 这 种 情况 下 ,数组 中 的 多 数 指针 都 是 NULL，。 












































试 着 记 住 trie 
术语 trie ( 单词 查找 树 ) 来 源 于 单词 retrieval ( 检索 ) 的 中 间 部 分 。 它 本 来 被 人 们 读 作 tree， 
好 在 现在 常见 读 法 已 经 将 其 读 为 发 音 有 区 别 的 try 了 。 





+ 示例 5.10 

树 可 以 用 来 表示 一 系列 单词 ， 其 表示 方式 可 以 使 检查 给 定 字符 序列 是 否 为 存在 的 单词 变 得 
非常 有 效率 。 在 这 类 称 为 单词 查找 树 的 树 中 ， 除 了 根 节 点 之 外 ， 每 个 节点 都 有 与 之 相关 联 的 字 
母 。 由 某 个 节点 1 表示 的 字符 串 ， 就 是 从 根 节 点 到 z 的 路 径 上 的 字母 序列 。 给 定 一 组 单词 ， 单 词 
查找 树 的 节点 就 是 那些 表示 该 集合 中 某 个 单词 的 前 缀 的 字符 串 。 节 点 的 标号 是 由 表示 该 节点 的 
字母 ， 以 及 表明 从 根 节 点 到 该 节点 的 字母 串 能 否 构成 完整 单词 的 布尔 值 组 成 的 。 如 果 能 ,就 用 
布尔 值 1 表示 ， 如 果 不 能 ， 就 用 0 表示 。” 

例如 ， 假 设 我 们 的 “字典 ”是 由 4 个 单词 he、hers、his 和 she 组 成 的 。 这 些 单词 的 单词 
查找 树 如 图 5-7 所 示 。 要 确定 单词 he 是 否 在 集合 中 ， 可 以 从 根 市 点 m1 开始， 移动 到 标号 为 h 的 子 
节点 n>， 青 从 节点 ns 移动 到 标号 为 e 的 子 节点 my。 因为 这 些 厄 点 都 出 现在 树 中 ， 而 且 n 的 标号 中 
还 有 1， 所 以 可 以 得 出 he 在 该 集合 中 的 结论 。 

















图 5-7 单词 he 、ners、his 和 she 的 单词 查找 树 





QD 在 5.2 节 中 ， 介 绍 过 的 标号 都 只 有 一 个 值 。 不 过 ， 值 可 以 是 任意 类 型 的 ， 而 且 标号 可 以 是 由 两 个 或 多 个 字段 组 成 
的 结构 体 。 在 本 例 中 ， 标 号 有 一 个 字段 是 个 字母 ， 而 第 二 个 字段 则 是 一 个 值 要 么 为 0 要 么 为 1 的 整数 。 
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再 举 一 个 例子 ,假设 想 要 确定 him 是 否 在 该 集合 中 。 可 以 从 根 节 点 开始 沿 着 路 径 移动 到 n，， 
再 移动 到 n;, 这 是 表示 前 级 hi 的 ,不 过 在 市 点 ns 处 找 不 到 对 应 字母 m 的 子 节点 。 所 以 可 以 得 出 him 
不 在 该 集合 中 的 结论 。 最 后 ， 如 果 查 找 单词 her， 那 么 可 以 找 出 从 根 节 点 到 节点 ny 的 路 径 。 该 
节点 存在 ,但 标号 不 含 1。 因 此 可 以 得 出 her 不 在 该 集合 中 的 结论 ， 虽然 以 它 为 真 前 级 的 单词 
hers 在 该 集合 中 。 

单词 查找 树 中 众 节 点 的 分 文系 数 就 等 于 构成 这 些 单词 的 字母 表 中 不 同 字 符 的 数目 。 例 如 ， 
如 果 不 区 分 大 小 写字 母 ， 而 且 单 词 中 不 含 撤 号 这 样 的 特殊 字符 ， 那 么 分 文系 数 就 等 于 26。 包 含 
两 个 标号 字段 的 节点 的 类 型 可 以 按照 图 $-8 中 所 示 的 方式 定义 。 在 数组 chi ldqren 中 ， 可 以 假设 
字母 as 是 用 下 标 0 表示 的 ， 而 下 标 1 表 示 字 母 b， 以 此 类 推 。 



































typedef struct NODE *pNODE; 
struct NODE { 
char letter; 


int 1ISWord ; 
PNODE children[BF]; 
}; 





图 5-8 ”字母 单词 查找 树 的 定义 


图 5-7 中 抽象 形式 的 单词 查找 树 可 以 用 图 5-9 所 示 的 数据 结构 表示 。 通 过 展示 前 两 个 字段 
letter 和 isWord,， 以 及 数组 chni1ldren 中 那些 具有 非 NULL 指 针 的 元 素 ， 从 而 表示 节点 。 在 
children 数 组 中 ， 对 每 个 非 NULL 的 元 素 ， 标 记 该 数组 的 字母 是 由 指 问 子 市 点 的 指针 上 方 的 
项 表示 的 , 不 过 该 字母 实际 上 没有 出 现在 该 结构 中 。 请 注意 , 根 节 点 的 letter 字 上 段 是 无 关 紧 
要 的 。 














图 5-9 ”图 5-7 中 所 示 单 词 查找 树 的 数据 结构 
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5.3.2 ” 树 的 最 左 子 节 点 右 兄弟 节点 表示 


使 用 指针 数组 表示 节点 的 空间 利用 率 可 能 很 低 ， 因 为 通常 情况 下 ， 绝 大 多 数 指针 都 会 是 
NULL。 图 5-9 显 然 就 是 这 种 情况 ， 其 中 没有 哪个 节点 有 两 个 以 上 非 NULL 指 针 。 事 实 上 ， 如 果 想 
想 这 种 情况 ， 就 会 发 现 ， 在 任何 基于 26 个 字母 的 字母 表 的 单词 查找 树 中 ， 指 针 的 数量 都 会 是 表 
示 节 点 的 指针 的 数量 的 26 倍 。 因 为 没有 哪个 节点 会 有 两 个 父 节 点 , 而 且 根 节点 是 没有 父 节 点 的 ， 
所 以 N 个 节点 中 只 有 N-1 个 非 NULL 的 指针 ， 也 就 是 说 ， 每 26 个 指针 中 只 有 不 到 1 个 是 有 用 的 。 

要 克服 树 的 指针 数组 表示 空间 利用 率 低 的 问题 ， 方 法 之 一 就 是 使 用 链表 来 表示 节点 的 子 节 
点 。 节 点 对 应 链表 所 占据 的 空间 是 与 该 节点 子 节点 的 数量 成 正比 的 。 不 过 ， 这 种 表示 方式 在 时 
间 上 要 付出 代价 ， 访问 第 i 个子 节点 所 需 时 间 为 0G) ， 因 为 在 到 达 第 i 个 节点 之 前 必须 遍历 长 度 
为 i-1 的 链表 。 与 之 相 比 ,使 用 指针 数组 表示 子 节点 的 话 ， 就 可 以 在 O() 时 间 内 到 达 第 ;个 子 节 
点 ， 跟 ;完全 没有 关系 。 

在 树 的 这 种 最 左 子 节点 右 兄弟 节点 ( leftmost-child-right-sibling ) 表示 中 ， 要 为 每 个 节点 放 
入 一 个 指向 其 最 左 子 节 点 的 指针 , 而 节点 没有 指向 它 其 他 子 节 点 的 指针 。 要 找到 节点 n 的 第 二 个 
及 后 续 的 子 节点 ,可 以 为 这 些 节 点 创建 一 个 链表 ,其 中 每 个 子 节点 c 都 指向 2 的 子 节点 中 紧 挨 在 c 
右 侧 的 那个 ， 该 节点 称 为 c 的 右 兄 弟 节点 。 


+ 示例 5.11 

在 图 5-1 中 ，n3 是 ns 的 右 见 弟 节 点 ，m4 是 m3 的 右 兄 第 记 点 ，m4 没 有 右 见 第 节点 。 沿 着 n1 指 问 其 
最 左 子 节 点 z 的 指针 ， 然 后 移 到 指 辐 肥 右 见 弟 节 点 吧 的 指针 ， 接 着 再 到 指 癌 右 兄弟 节点 局 的 指 
针 ， 就 能 找 出 nj 的 子 节点 。 接 着 就 会 发 现 一 个 为 NULL 的 右 兄弟 节点 指针 ， 并 知道 hn 没有 更 多 子 
节点 了 。 

图 $-10 简 要 绘 出 了 图 $-1 所 示 树 的 最 左 子 节 点 右 兄 弟 节 点 表示 。 回 下 的 箭头 是 指 最 左 子 节 点 
链接 ， 而 回 右 的 箭头 则 是 右 兄 第 节点 链接 。 


CO 


图 5-10 图 5-1 中 所 示 树 的 最 左 子 节 点 右 兄 弟 节点 表示 
在 树 的 最 左 子 节 点 右 见 弟 节 点 表示 中 ， 节 点 是 按照 如 下 方式 定义 的 。 


typedef struct NODE *pNODE; 
struct NODE +{ 
int info; 
PNODE leftmostChild, rightSibling; 




















}; 
info 字 上 段 存放 着 与 节点 相关 联 的 标号 ， 而且 可 以 是 任 一 类 型 的 。 字 上段 leftmostChilgd 和 
rightSibling 指 向 最 左 子 市 点 以 及 相应 的 右 兄弟 方 点 。 请 注意 ， 尺 管 leftmostchi1d 给 出 
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了 有 关 该 节点 目 身 的 信息 , 但 节点 的 right sibling 字 上 段 才 是 真正 表示 该 节点 父 节 点 全 部 子 节 
点 的 链表 的 那 一 部 分 。 


+ 示例 5.12 
现在 将 图 $-7 中 的 单词 查找 树 表 示 成 最 左 子 节 点 右 兄 第 节点 的 形式 。 首 先 , 节点 的 类 型 如 下 。 
typedef struct NODE *pNODE; 
struct NODE { 
char letter; 
int isWord; 
PNODE leftmostChild, rightSibling; 
根据 示例 5.10 中 描述 过 的 模式 ， 前 两 个 字段 是 表示 信息 的 。 图 5-7 中 的 单词 查找 树 可 表示 为 
图 $-11 所 示 的 数据 结构 。 请 注意 ， 每 个 叶子 节点 都 有 为 NULL 的 最 左 子 节 点 指针 ， 而 每 个 最 右 子 
节点 都 有 为 NULL 的 右 兄弟 节点 指针 。 

















图 5-11 所 示 单 词 查 找 树 的 最 左 子 市 点 右 见 第 节点 表示 


举 个 与 最 左 子 贡 点 右 见 弟 节 点 表示 的 用 途 有 关 的 例子 。 在 图 5-12 中 ， 极 数 seek (let，n) 
会 接受 字母 let 以 及 指 癌 节点 n 的 指针 作为 参数 。 它 会 返回 一 个 指针 ， 指 向 的 子 节点 中 letter 
字段 里 有 ?et 的 那个 子 节 点 ， 如 果 不 存在 这 样 的 节点 ， 返 回 的 就 是 NULL 指 针 。 如 果 发 现 /ef， 或 是 
检查 过 所 有 的 子 方 点 ， 就 会 达到 第 (6) 行 ， 并 跳出 该 循环 。 不 管 是 哪 种 情况 ，c 都 存放 着 正确 的 
值 ， 如 果 存 在 存放 了 ?et 的 子 节 点 ， 就 是 指向 该 节点 的 指针 ， 如 果 不 存 在 ， 就 是 NULL 指 针 。 

请 注意 ，seek 国 数 的 运行 时 间 与 找到 所 要 找 的 子 节 点 所 必须 检查 的 子 节 点 数 成 正比 , 如果 
根本 找 不 着 这 样 的 节点 ,那么 运行 时 间 就 与 节点 ?的 子 节 点 数 成 正比 。 与 之 相 比 的 是 ,如 果 使 用 
树 的 指针 数组 表示 ，seek 会 直接 返回 字母 /et 对 应 的 数组 元 素 的 值 ， 花 的 时 间 为 O0) 。 
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PNODE seek(char let, pNODE n) 


{ 
(1) c = n->leftmostChild; 
(2) while (c != NULL) 
(3) if (c->letter == let) 
(4) break; 
else 
(5) c = c->rightSiblineg; 
(6) return c; 


} 





图 5-12 ”找到 所 需 字 母 对 应 的 子 节 点 


5.3.3” 父 指针 


有 些 时 候 ， 在 表示 节点 结构 体 中 包含 指向 其 父 节 点 的 指针 是 很 有 用 的 ， 而 根 节 点 的 父 指 针 
为 NULL。 例 如， 示例 5.12 中 的 结构 体 就 成 了 
typdef struct NODE *pNODE; 
struct NODE { 
char letter; 
int isWord; 
PNODE leftmostChild, rightSibling, parent; 
}; 
有 了 这 种 结构 体 ， 就 可 以 确定 某 给 定 方 点 表示 的 单词 了 了。 不断 回 溯 父 指针 ， 直 到 到 达 根 市 
点 ， 我 们 就 可 以 确认 根 节点 ， 因 为 只 有 它 的 parent 指 针 的 值 是 NULL。 这 一 路 下 来 的 letter 
字段 就 倒 着 拼 出 了 该 单词 。 


5.3.4 习题 


(1) 对 图 5-5 所 示 树 中 的 每 个 节点 ， 它 们 的 最 左 子 节点 和 右 兄 弟 节 点 。 
(2) 请 进行 下 列 操作 。 
(a) 将 图 5$-5 中 的 树 表示 为 分 支 系数 为 3 的 单词 查找 树 。 
(b) 用 最 左 子 市 点 指针 和 右 兄 第 节点 指针 来 表示 图 $-$ 中 的 树 。 
每 种 表示 方式 各 需要 多 少 字 节 的 内 存 ? 
(3) 考虑 英语 中 单数 人 称 代 词 的 如 下 集合 : I、my、mine、me、 you、 your、 yours、 he、 his、him、she、 
her 、hers。 对 图 $-7 所 示 的 单词 查找 树 加 以 补充 ， 从 而 将 这 13 个 单词 都 包含 在 内 。 














(4) 假设 某 部 完整 的 英语 词典 包含 了 2 000 000 个 单词 ， 以 及 1 000 000 个 单词 前 缀 一 一 也 就 是 在 其 尾部 
加 上 0 个 或 多 个 字母 便 能 构成 单词 的 字母 串 。 
(a) 这 部 词典 的 单词 查找 树 共 有 多 少 个 节点 ? 
(b) 假设 使 用 示例 5.10 中 的 结构 体 表示 节点 。 设 指针 需要 4 字 节 ， 且 信息 字段 letter 和 isWord 各 











需要 1 字 节 ， 那 么 这 棵 单词 查找 树 需 要 多 少 字 贡 ? 
(c) 在 (b) 小 题 计算 出 的 空间 中 ， 有 多 少 是 被 NULL 指 针 占 据 的 ? 

(5) 假设 用 示例 5.12 中 的 结构 体 ( 最 左 子 节点 右 兄弟 节点 表示 ) 来 表示 习题 (4) 中 描述 的 词典 。 假 设 指 
针 和 信息 字段 占据 的 空间 与 习题 (4) 的 (b) 小 题 中 的 假设 相同 ,那么 这 种 表示 中 这 棵 树 需 要 占据 多 少 
空间 ? 在 该 空间 中 NULL 指 针 占 的 比例 又 是 多 少 ? 

(6) 在 树 中 ， 如 果 节 点 c 同 为 x 和 y 的 祖先 ， 而 且 c 的 真子 孙 中 没 有 一 个 同时 是 x 和 y 的 祖先 ， 那么 就 说 c 是 
x 和 和 y 的 最 低 共同 祖先 。 编 写 程序 ,使 其 能 找 出 给 定 的 树 中 任 一 对 节点 的 最 低 共同 祖先 。 在 这 种 程 
序 中 使 用 什么 数据 结构 表示 树 比 较 好 ? 
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树 的 表示 的 对 比 


这 里 总 结 了 树 的 指针 数组 表示 ( 单词 查找 树 ) 与 最 左 子 节点 右 兄弟 节点 oe 

口 指针 数组 表示 带 来 了 更 快 的 子 节点 访问 速度 ， 不 管 有 多 少子 节点 ， 到 达 任 意 子 节点 都 只 
需要 OU) 的 时 间 。 

口 最 左 子 节 点 右 兄 弟 节 点 we 以 图 5-7 所 示 的 单词 查找 树 为 例 ， 如 果 使 
用 指针 数组 表示 ， 那 么 每 个 节点 含有 26 个 指针 ， 而 如 果 使 用 最 左 子 节点 右 兄 弟 节 点 表示 ， 
每 个 节点 只 含 两 个 指 

口 最 左 子 节点 右 兄 弟 节点 表示 不 要 求 对 节点 的 分 支 系数 加 以 限制 ， 因 此 可 以 在 不 改变 数据 
结构 的 前 提 下 表示 具有 任 一 分 支 系数 的 树 。 然 而 ， 如 果 使 用 指针 数组 表示 ， 一 旦 选择 了 
数组 的 大 小 ， 就 不 能 表示 具有 更 大 分 支 系数 的 树 了 。 





5.4 ”对 树 的 递归 


对 树 进行 的 递归 操作 可 以 自然 清晰 地 写 下 来 ,这样 的 操作 数量 之 多 突显 了 树 的 实用 性 。 图 

5-13 展 示 了 接受 树 的 节点 n 作 为 参数 的 递归 函数 Fln) 的 一 般 形 式 。F 首 先 会 执行 一 些 步 又 (也 可 

能 不 执行 任何 步 又 )， 我 们 将 其 表示 为 操作 4o。 接 着 ，F 会 对 mn 的 第 一 个 子 节 点 cl 调用 它 上 自身。 在 

这 次 递归 调用 中 ，F 将 会 “探索 ”以 ci 为 根 方 点 的 子 树 ， 进 行 F 对 树 进行 的 任何 操作 。 当 该 调用 

返回 对 市 点 n 的 调用 时 ,就 会 执行 男 一 个 操作 41。 接着 F 会 在 n 的 第 二 个 子 太 点 上 被 调用 , 引起 对 
第 二 棵 子 树 的 探索 ， 以 此 类 推 ， 就 是 对 "的 操作 与 在 xz 的 子 节 点 对 F 的 调用 交 蔡 着 进行 。 


7 
有 2 


(a) 树 的 一 般 形 式 
F (n) 
{ 
action A,; 
Fe); 
action 4 
Fe,); 


action A,; 


Tc) ; 


action A,; 





(b) 对 树 进行 递归 的 函数 Fn) 的 一 般 形式 
图 5-13 ”对 树 进 行 递归 的 函数 
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+ 示例 5.13 

对 树 进行 简单 的 递归 会 产生 树 的 节点 标号 的 前 序 排列 ( preorder listing )。 这 里 的 操作 4 是 
打印 节点 的 标号 ， 而 其 他 的 操作 也 无 非 是 些 “ 分 门 别 类 进行 记录 ”的 操作 ， 这 些 操 作 可 以 让 我 
们 访问 给 定 节 点 的 每 个 子 节 点 。 效果 就 是 , 如 果 从 根 节点 开始 逆 时 针 环 游 访 问 树 中 的 每 个 节点 ， 
在 第 一 次 遇 到 这 些 节 点 时 会 将 它们 的 标号 打印 出 来 。 请 注意 ， 只 有 在 第 一 次 访问 某 个 节点 时 才 
将 其 标号 打印 出 来 。 这 种 环 游 如 图 $-14 中 的 箭头 所 示 ， 访 问 这 些 节点 的 顺序 是 
+a+x# 一 0 一 cc 一 sdx+ 。 这 一 节点 标号 序列 的 前 序 排 列 是 +a* -pcd 。 














图 5-14 ”表达 式 树 及 其 环 游 


假设 为 表达 式 中 标号 为 一 个 字母 的 节点 使 用 最 左 子 节点 右 兄弟 节点 的 表示 方式 。 内 部 节点 
的 标号 是 该 节点 处 的 算术 运算 符 ， 而 叶子 节点 的 标号 是 表示 操作 数 的 字母 。 节 点 和 指向 节点 的 
旨 针 可 以 按照 如 下 方式 定义 。 
typedef struct NODE *pNODE; 
struct NODE { 
char nodeLabe!l; 
PNODE leftmostChild, rightSibling; 
}; 
函数 preorder 如 图 5-15 所 示 。 在 随后 的 解说 中 ， 可 以 很 自然 地 将 指向 节点 的 指针 看 作 方 
所 本 里 。 





void preorder (pNODE n) 


{ 
PNODE c; /* 节点 nn 的 子 节点 */ 


printf("%c\n", n->nodeLabel); 
c = n->leftmostChild; 
while (c != NULL) { 
Preorder(c) ; 
c= c->rightSibling; 


HO ee gl 
OOD- 
apt Na a Wd Ma 








图 5-15 ”前 序 遍 历 函 数 
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操作 “4o。” 由 图 5-15 所 示 程 序 的 以 下 儿 个 部 分 组 成 。 

(1) 在 第 (1) 行 ,打印 节 点 n 的 标号 ; 

(2) 在 第 (2) 行 ， 将 c 初 始 化 为 n 的 最 左 子 市 点 ; 

(3) 在 第 (3) 行 ， 执 行 第 一 次 c != NUIL 的 测试 。 

第 (2) 行 会 初始 化 一 个 循环 ， 在 该 循环 中 ，c 会 依次 成 为 n 的 每 个 子 节点 。 请 注意 ， 如 果 n 是 
叶子 节点 ， 那 么 c 就 会 在 第 (2) 行 被 赋 上 NULL 值 。 

第 (3) 行 到 第 (5) 行 的 while 循 环 会 一 直 进 行 ,直到 遍历 完 n 的 所 有 子 节点 。 对 每 个 子 节 点 而 言 ， 
会 在 第 (4) 行 对 该 节点 递归 地 调用 函数 preordqer, 接着 在 第 (5) 行 行进 到 下 一 个 子 节点 。i 宇 1 的 
每 个 操作 4， 都 是 由 证 c 在 xz 的 子 节 点 中 移动 的 第 (3) 行 ， 以 及 测试 是 否 遍 历 完 子 节 点 的 第 (3) 行 组 
成 的 。 这 些 操作 都 只 是 分 门 别 类 地 记录 而 已 ， 与 此 相 比 ， 第 一 行 中 的 操作 4 完成 的 是 关键 步 又: 
打印 标号 。 

对 图 5-14 中 所 示 树 的 根 节点 调用 preorder 的 一 系列 事件 可 总 结 为 图 5-16 所 示 的 情形 ,每 一 
行 左 侧 的 字符 就 是 在 对 preorder (n) 的 调用 正在 被 执行 时 节点 n 的 标号 。 因 为 没有 哪 两 个 节点 
的 标号 会 相同 ， 所 以 使 用 节点 的 标号 作为 其 名 称 是 没有 问题 的 。 请 注意 ， 打 印 出 的 字符 是 
+a*--bcd ， 这 一 打印 顺序 就 和 环 游 的 顺序 一 样 。 




















调用 preorder(+) 
+ 打印 + 

+ 调用 preorder (a) 

a 打印 a 

+ 调用 preorder (*) 

* 打印 * 

调用 preorder (-) 

一 打印 一 

=) 调用 preorder(b) 
b 打印 b 

一 调用 preorder (c) 
C 打印 c 

四 调用 preorder (qd) 

a 打印 d 











图 5-16 递归 函数 preorder 对 图 5-14 所 示 树 进行 的 操作 


+ 示例 5.14 

另 一 种 为 树 中 节点 排序 的 常见 方式 是 后 序 ， 对 应 图 5-14 所 示 树 的 环 游 ， 不 过 会 列 出 最 后 访 
问 的 节点 ， 而 不 是 第 一 次 访问 的 节点 。 例 如 ， 在 图 5-14 中 ， 后 序 排列 就 是 abc -qd x*+。 

要 生成 节点 的 后 序 排列 ， 需 要 由 最 后 的 操作 来 完成 打印 ， 这 样 才 会 在 对 节点 的 所 有 子 节点 
从 左 起 依次 调用 后 序 排列 函数 之 后 ， 再 打印 该 节点 的 标号 。 其 他 的 操作 则 会 初始 化 穿越 子 节点 
或 移动 到 下 一 子 节点 的 循环 。 请 注意 ， 如 果 某 个 节点 是 叶子 节点 ， 那 么 要 做 的 只 有 列 出 标号 ， 
而 不 存在 任何 递归 调用 。 

如 果 使 用 示例 5.13 介 绍 的 节点 表示 方式 ， 就 可 以 通过 图 5-17 中 的 递归 函数 postorgder 构 建 
后 序 排列 。 在 对 图 5-14 所 示 树 的 根 节点 调用 该 函数 时 的 操作 如 图 5-18 所 示 , 这 里 使 用 了 与 图 5-16 
中 一 致 的 节点 名 称 转换 方式 。 
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void postorder (pNODE n) 
{ 
PNODE c; /* 节点 nn 的 子 节 点 */ 


(1) c = n->leftmostChild; 
(2) While (c != NULL) { 
(3) postorder(c); 
(4) c = c->rightSibling; 
} 
(5) printf("%c\n", n->nodeLabel); 





图 5-17 递归 的 后 序 浮 数 


调用 preorder(+) 
调用 preorder(a) 
打印 a 
调用 preorder(*) 
调用 preorder(-) 
调用 preorder(b) 
打印 b 


调用 preorder(c) 
打印 c 
打印 一 
调用 preorder(q) 
打印 qd 
打印 * 
打印 + 





图 $-18 ”递归 消 数 postorder 对 图 5-14 所 示 树 进行 的 操作 


+ 示例 5.15 

接 下 来 的 例子 要 求 我 们 在 对 子 树 进行 的 所 有 递归 调用 中 执行 一 些 重大 操作 。 假 设 给 定 一 棵 
表达 式 树 , 其 中 以 整数 为 操作 数 ， 并 使 用 二 元 运算 符 , 而 且 希 望 得 出 该 树 表 示 的 表达 式 的 数值 。 
我 们 可 以 通过 对 该 表达 式 树 执行 以 下 递归 算法 达成 这 一 目的 。 

依据 。 对 于 一 个 叶子 节点 ， 得 出 该 节点 的 值 作为 树 的 值 。 

归纳 。 假 设 要 计算 以 某 个 节点 n 为 根 节点 的 子 树 形成 的 表达 式 的 值 。 我 们 要 为 以 n 的 子 节 
点 为 根 节 点 的 子 树 所 对 应 的 子 表达 式 求 值 ， 这 两 个 值 是 节点 a 处 的 运算 符 对 应 的 操作 数 的 值 。 
接着 就 可 以 对 这 两 个 子 树 的 值 应 用 标号 为 n 的 运算 符 ， 这 样 就 得 到 了 以 n 为 根 节点 的 整 棵 子 树 
的 值 。 








前 缀 表达 式 和 后 缀 表达 式 


如 果 以 前 序列 出 表达 式 树 的 标号 ， pe 了 给 定 表达 式 的 前 级 表达 式 。 同 样 ， 以 后 序列 出 
表达 式 树 的 标号 就 得 出 等 价 的 后 级 表 达 式 。 而 普通 概念 的 表达 式 , 就 是 二 元 运算 符 出 现在 操作 
数 之 间 的 表达 式 ， 称 为 中 级 表达 式 。 例 an ge 14 中 表达 式 树 的 We at+(b—c)*d 。 
正如 我 们 在 示例 5.13 和 示例 5.14 中 所 见 ， 等 价 的 前 级 表达 式 是 +ax-bcd ， 等 价 的 后 组 表达 式 是 
abc—d*+t。 
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有 个 有 关 前 缓和 后 缓 概念 的 有 趣事 实 ， 只 要 每 个 运算 符 都 有 唯一 的 参数 数量 ( 比如 ,不 能 
同时 使 用 一 元 和 二 元 的 减 号 )， 那 么 就 算 没 有 括号 ， 也 还 是 能 清楚 地 将 运算 符 与 它们 对 应 的 操 
作 数 进行 分 组 。 

可 以 按照 如 下 方式 由 前 组 表达 式 构 建 中 组 表达 式 。 在 前 缀 表达 式 中 ,可 以 看 到 运算 符 后 跟 
着 所 需 数量 的 操作 数 ， 而 没有 内 赃 的 运算 符 。 例如， 在 前 级 表达 式 +ax-bcd 中 , 子 表达 式 -pc 
就 是 这 样 一 个 字符 囊 ， 因 为 这 个 减 号 像 此 例 中 的 所 有 运算 符 一 样 是 二 元 的 。 我 们 可 以 用 新 符号 
来 代替 该 子 表达 式 ， 比如 说 设 x= -bc ,接着 再 重复 这 一 确定 运算 符 后 跟 其 对 应 操作 数 的 过 程 。 
在 本 例 中 ， 就 是 要 对 +aqxxpb 进行 处 理 。 在 这 里 可 以 确定 子 表达 式 y=x*xqd ， 并 将 剩余 的 字符 串 
缩减 为 +ay 。 现 在 剩 下 的 字符 囊 就 只 有 一 个 运算 符 和 它 的 操作 数 了 ,这 样 就 可 以 转换 为 中 缓 表 
达 式 q+y。 

现在 就 可 以 通过 重 现 这 些 步骤 来 重建 中 组 表达 式 中 剩 下 的 部 分 了 。 可 以 看 到 子 表达 式 
y=*Xxd 的 中 缓 形式 为 Y*d ， 所 以 可 以 将 a+) 了 中 的 ) 蔡 换 为 Y*d ， 这 样 就 得 到 了 a+(x*d)。 
请 注意 ， 一 般 来 说 ， 中 组 表达 式 里 是 需要 括号 的 ， 虽 然 在 本 例 中 在 为 操作 数 分 组 时 因为 * 的 优 
先 级 比 + 高 所 以 省 略 了 这 对 括号 。 接 着 将 x= -bc 蔡 换 为 中 绥 表 达 式 b-c ， 便 可 得 到 最 终 的 表 
达 式 为 a+((b 一 c)*d)， 这 与 图 5-14 中 的 树 表 示 的 表达 式 是 相同 的 。 

对 后 级 表达 式 来 说 , 可 以 利用 相似 的 算法 。 唯一 的 区 别 就 是 在 分 解 后 缀 表达 式 时 是 要 看 运 
算 符 以 及 放 在 它们 前 面 的 必要 数量 的 操作 数 。 








我 们 将 指向 节点 的 指针 与 节点 定义 如 下 。 
typedef struct NODE *pNODE; 
struct NODE { 
char op; 
int value; 
PNODE leftmostChild, rightSibling; 
}; 
字段 op 存放 的 要 么 是 表示 算术 运算 符 的 字符 ， 要 么 是 字符 i ， 这 里 的 i 代表 integer ( 整数 )， 并 
确认 点 为 叶子 节点 。 如 果 该 节点 是 叶子 节点 ， 那 么 value 字 段 就 存放 着 该 节点 表示 的 整数 ， 
在 处 理 内 部 节点 时 是 用 不 上 value 的 。 
这 一 概念 允许 运算 符 具 有 任意 数量 的 参数 ， 虽 然 我 们 在 编写 代码 时 会 出 于 简便 性 的 考虑 而 
假设 所 有 运算 符 都 是 二 元 的 。 代 码 如 图 5-19 所 示 。 
如 果 节 点 1 是 叶子 节点 ， 第 (ID) 行 的 测试 会 成 功 ， 并 在 第 (2) 行 返回 该 叶子 节点 的 整数 标号 。 
如 果 该 节点 不 是 叶子 节点 , 那么 会 在 第 (3) 行 给 它 的 左 操作 数 求 值 ， 并 在 第 (4) 行 给 它 的 右 操 作 数 
求 值 , 分 别 将 结果 存 和 val1l 和 va1l2。 联系 第 (4) 行 的 表示 ,可 以 注意 到 节点 n 的 第 二 个 子 节 点 就 
是 节点 n 最 左 子 节 点 的 右 兄 第 节点 。 第 (5) 行 到 第 (9) 行 形成 了 一 个 switch 语 句 ， 在 该 语句 中 要 决 
定 7 处 为 何 种 运算 符 ， 并 为 左 操作 数 和 右 操作 数 的 值 应 用 合适 的 运算 。 
例如 ， 考 虑 图 $-20 中 所 示 的 表达 式 树 。 在 图 $-21 中 我 们 还 会 看 到 在 为 该 表达 式 求 值 时 ， 每 
个 节点 处 进行 的 调用 和 返回 的 序列 。 和 以 往 一 样 ， 要 利用 到 节点 标号 是 唯一 的 这 一 事实 ， 并 用 
它们 的 标号 来 为 其 命名 。 


























196 第 5 章 树 








int eval (pNODE n) 


{ 
int val1，val2; /* 第 一 棵 子 树 和 第 二 棵 子 树 的 值 */ 


(1) if (n->op) == 'i') /* n points to a leaf */ 
(2) return n->value; 
else {/* n 指向 内 部 节点 */ 
) vall = eval(n->leftmostChild); 
) Val2 = eval(n->leftmostChild->rightSibling); 
) switch (n->op) { 
) case '+': return Vall + val2; 
) case '-': return vall - val2; 
) case '*': return vall * val2; 
) case '/': return valli / val2; 








图 5-20 ”操作 数 为 整数 的 表达 式 树 





调用 eval (+) 
+) 调用 eval(5) 

返回 5 
调用 eval ( *) 

调用 eval (-) 
一 调用 eval (10) 
10) 返回 10 
一 调用 eval (3) 
3 返回 3 
一 返回 7 
) 调用 eval (2) 
2) 返回 2 
) 
) 








* 


* 


返回 14 
返回 19 








图 5-21 ”函数 eval 在 图 5-20 所 示 树 的 每 个 节点 处 进行 的 操作 


+ 示例 5.16 
有 时 需要 确定 树 中 各 节点 的 高 度 ， 节 点 的 高 度 可 由 以 下 函数 递归 地 定义 。 








5.4 对 树 的 递归 197 





依据 。 叶 子 方 点 的 高 度 为 0。 

归纳 。 内 部 节点 的 高 度 要 比 其 子 节 点 最 大 的 高 度 大 1。 

可 以 将 这 一 定义 转换 成 递归 程序 ， 该 程序 会 将 每 个 节点 的 高 度 计算 出 来 存放 到 height 字 
段 中 。 

依据 。 在 叶子 节点 处 ， 将 高 度 置 为 0。 

归纳 。 在 内 部 节点 ,递归 地 计算 子 节 点 的 高 度 , 找 出 最 大 值 , 加 上 1, 并 将 结果 存储 到 heignt 
于 届 中 ， 

该 程序 如 图 5-22 所 示 ， 假 设 方 点 是 具有 如 下 形式 的 结构 体 。 


typedef struct NODE *pNODE; 
struct NODE { 

int height; 

PNODE leftmostChild, rightSibling; 
}; 


computeHt 辑 数 接 受 指 向 节点 的 指针 作为 参数 ， 并 计算 出 该 节点 的 高 度 存放 到 height 字 
段 中 。 如 有 果 在 树 的 根 节 点 处 调用 该 函数 ， 就 会 计算 该 树 中 所 有 节点 的 高 度 。 








void computeHt (pNODE n) 


{ 
PNODE c ; 

(1) n->height = 0; 
(2) c = n->leftmostChild; 
(3) while (c != NULL) { 
(4) computeHt(c) ; 
(5) if (c->height >= n->height) 
(6) n->height = 1+c->height; 
(7) c = c->rightSibling; 


} 
} 








图 5-22 ”计算 树 中 所 有 节点 高 度 的 例 程 


在 第 (1) 行 ， 我 们 会 将 n 的 高 度 初始 化 为 0。 如 果 n 是 叶子 节点 ,计算 就 算 完成 了 ， 因 为 第 (3) 
行 的 测试 将 会 立即 失败 ， 所 以 算出 的 任何 叶子 节点 的 高 度 都 为 0。 第 (2) 行 会 将 c 置 为 (指向 ) 7 
的 最 左 子 节 点 ( 的 指针 )。 随 着 不 断 进 行 第 (G3) 行 至 第 (7) 行 的 循环 ，c 依 次 成 为 的 每 个 子 节 点 。 
第 (4) 行 会 递归 地 计算 c 的 高 度 。 随 着 计算 的 进行 ,n->heignt 中 的 值 会 比 目 前 最 高 的 子 节 点 高 
度 大 1， 不 过 如 果 没 有 子 节 点 ， 这 个 值 就 是 0。 因 此 ， 第 (5) 行 和 第 (6) 行 在 发 现 比 之 前 的 子 节点 更 
高 的 子 节 点 后 会 增加 xz 的 高 度 。 此 外 ， 对 第 一 个 子 节点 ， 第 (3) 行 的 测试 是 肯定 会 被 满足 的 ， 而 
且 我 们 会 将 n->height 置 为 比 第 一 个 子 节 点 的 高 度 大 1。 在 因为 处 理 完 所 有 子 节 点 而 跳出 循环 
后 ，n->height 就 会 被 置 为 比 x 子 节点 中 的 最 大 高 度 大 1。 

















程序 设计 还 要 更 具 防 御 性 
图 $-19 中 的 程序 有 若干 方面 表现 出 了 一 种 粗心 的 编程 风格 ， 这 是 应 该 避免 的 。 具 体 来 说 ， 
我 们 在 没有 首先 检查 指针 是 否 为 NULL 的 情况 下 就 一 路 前 进 了 。 因 此 ， 在 第 (1) 行 ，n 是 可 能 X 
NULL 的 。 我 们 真 应 该 将 程序 以 如 下 形式 开头 。 
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if (n != NULL) /* then do lines (1) to (9) */ 
else /* print an error message */ 


即便 n 不 是 NULL， 在 第 (3) 行 还 是 可 能 看 到 它 的 leftmostChild 字 段 是 NULL， 因 此 应 该 检测 一 
下 n->leftmostChild 是 否 为 NULL, 如 果 是 , 就 打印 出 错误 消息 , 而 且 不 去 调用 eval。 同样 ， 
即便 n 的 最 左 子 节点 存在 ， 该 子 节 点 也 可 能 没有 右 兄 弟 节点 ， 所 以 在 第 (4) 行 之 前 还 需要 检查 





n->leftmostChild->rightSibling != NULL 

而 且 该 程序 还 依赖 于 树 中 节点 所 含 信息 是 正确 的 这 一 假设 。 例 如 ， 如 果 某 个 节点 是 内 部 节 
点 ， 它 的 标号 为 二 元 运算 符 , 而 且 我 们 已 经 假设 它 有 具有 两 个 子 节点 ， 并 且 第 (3) 行 和 第 (4) 行 的 
间 针 不 可 能 为 NULL。 不 过 ， 运 算 符 标 号 有 可 能 是 不 正确 的 。 要 正确 处 理 这 种 情形 ， 就 应 该 在 
switch 语 名 中 加 入 default 情 况 ， 以 检测 意料 之 外 的 运算 符 标 号 。 

作为 一 般 规则 ， 对 程序 的 输入 永远 正确 这 一 假设 的 依赖 过 分 简单 了 ; 在 现实 中 ,“ 只 要 有 
可 能 出 错 ， 就 肯定 会 出 错 。 ”如果 某 个 程序 要 使 用 多 次 ， 势 必 会 遇 到 那些 形式 不 符合 程序 员 预 
想 的 数据 。 在 实践 中 多 么 小 心 都 不 为 过 。 育 目地 接受 NULL 指 针 ， 或 假设 输入 数据 总 是 正确 的 ， 
都 是 常见 的 编程 错误 。 








习题 


(1) 编写 递归 程序 ， 计 算 用 最 左 节点 指针 和 右 兄 弟 节 点 指针 表示 的 树 的 节点 数量 。 

(2) 编写 递归 程序 ， 找 到 树 中 具有 最 大 标号 的 节点 。 假 设 该 树 节 点 的 标号 都 为 整数 ， 而 且 是 用 最 左 子 
节点 右 见 第 节点 指针 表示 的 。 

(3) 修改 图 5-19 中 的 程序 ， 使 其 能 处 理 含有 一 元 减 写 节点 的 树 。 

(4) * 编写 递归 程序 ， 为 最 左 子 节点 右 见 弟 节点 指针 表示 的 树 计算 左右 对 的 数量 。 所 谓 左 右 对 ， 就 是 
指 节点 1 在 m 左 侧 这 样 的 一 对 市 点 nz 和 7m。 例 如 ， 在 图 $-20 中 ， 节 点 5 就 在 标号 为 *、-、10、3 和 2 的 
节点 左 侧 ， 而 节点 10 在 节点 3 和 节点 2 左 侧 ， 节 点 -在 节点 2 左 侧 。 因 此 ， 该 树 的 左右 对 共有 8 对 。 
提示 : 在 对 节点 n 调 用 编写 的 递归 函数 时 ， 要 让 该 函数 返回 两 个 部 分 ， 以 n 为 根 节 点 的 子 树 中 左右 
对 的 数量 ,， 还 有 以 n 为 根 节 点 的 子 树 中 节点 的 数量 。 

(5) 以 (a) 前 序 和 (b) 后 序列 出 图 5-5 中 ( 见 5.2 节 的 习题 ) 树 的 节点 。 

(6) 对 如 下 各 表达 式 
() (x+y)*(x+2) 

(i) ((x—y)*2+(y—w))*x 

(ii) ((((axx+b)xxtc)*xtad)exte)rxtf 
完成 以 下 操作 : 

(a) 构建 表达 式 树 ; 

(b) 写 出 等 价 的 前 级 表达 式 ; 

(c) 写 出 等 价 的 后 缀 表达 式 。 

(7) 将 后 缀 表达 式 ab +cxde--/f 转换 为 (a) 中 级 表达 式 和 (b) 前 级 表达 式 。 

(8) 编写 孔 数 ， 使 其 可 以 “ 环 游 ” 树 ， 并 在 经 过 节点 时 打印 节点 的 名 称 。 

(9) 图 5-17 中 的 后 序 了 水 数 进行 的 操作 4o、4i1 等 各 是 什么 ?” (“操作 ”就 是 如 图 5-13 所 指 的 那些 。) 


5.5 结构 归纳 法 


第 2 草 和 第 3 章 已 经 介绍 了 不 少 有 关 整 数 属性 的 归纳 证 明 。 可 以 假设 某 一 命题 对 n 来 说 为 真 ， 
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或 者 假设 命题 对 所 有 小 于 等 于 n 的 整数 都 成 立 ， 并 使 用 该 归纳 假设 证 明 同 一 命题 对 n+1 也 成 立 。 
“结构 归纳 法 ”与 之 类 似 但 不 尽 相 同 , 适用 于 证 明 与 树 有 关 的 属性 。 结构 归纳 法 模拟 了 对 树 的 递 
归 算 法 ,而 且 这 种 形式 的 归纳 法 在 想 要 证 明 一 些 与 树 有 关 的 命题 时 是 最 易于 使 用 的 。 





假设 要 证 明 命题 S(T) 对 所 有 的 树 7 部 为 真 。 作 为 依据 ， 要 证 明 SG7) 对 由 单一 节点 组 成 的 树 
7 为 真 。 而 对 归纳 部 分 来 说 ， 要 假设 7 是 一 棵 以 x 为 根 节点 ， 并 有 子 节 点 c1、c2、*…、cx (Kk 三 1 ) 


的 树 。 如 图 5-23 所 示 ， 设 TI、 雹 、…、T 分 别 是 以 c1、cp、…、ci 为 根 节点 的 7 的 子 树 。 那 么 归纳 
步骤 就 是 假设 S(TI)、S()、…、S(TW 都 为 真 ， 并 证 明 S(T) 。 如 果 完 成 了 这 一 证 明 ， 就 可 以 得 出 
SG7) 对 所 有 的 树 7 痢 成 立 的 结论 。 这 种 形式 的 论证 就 叫 作 结构 归纳 法 。 请 注意 ， 除 了 要 区 分 依 
据 部 分 〈1 个 节点 ) 和 归纳 步骤 (多 于 1 个 节点 )， 结 构 归 纳 法 不 会 提 及 树 中 具体 的 节点 数 。 


图 5-23 ” 树 及 其 子 树 


+ 示例 5.17 

一 般 情况 下 ， 在 证 明 对 树 进行 操作 的 递归 程序 时 会 需要 用 到 结构 归纳 法 。 举 例 来 说 ， 可 以 
再 次 看 看 图 5-19 所 示 的 eval 函 数 , 图 5-24 重 现 了 该 函数 的 函数 体 。 只 要 将 指向 7 根 节点 的 指针 赋 
值 给 该 函数 的 参数 nx， 就 可 将 该 函数 应 用 于 树 T7。 然 后 它 就 会 计算 由 7 表示 的 表达 式 的 值 。 接 下 
来 要 用 结构 归纳 法 证 明 如 下 命题 。 














(1) if (n->op) =='i' ) /* n 指向 叶子 节点 */ 
(2) return n->value; 

else {/* n 指向 内 部 节点 */ 
(3) vall = eval(n->leftmostChild); 
(4) val2 = eval(n->leftmostChild->rightSibling); 
(5) switch (n->op) T{ 
(6) case '+': return vall + val2; 
(7) case '-': return vali - val2; 
(8) case '*': return vallil * val2; 
(9) case '/': return Vall / val2; 

了 


图 5-24 ”图 5-19 中 eval (n) 函数 的 函数 体 


命题 S(T)。 在 对 7 的 根 节 点 调用 eval 时 ,返回 的 值 是 7 所 表示 的 算术 表达 式 的 值 。 

依据 。 作 为 依据 ,7 由 单个 三 点 组 成 。 也 就 是 说 ,参数 n 是 一 个 ( 指 疝 ) 叶子 节点 (的 指针 )。 
因为 在 该 节点 表示 操作 数 时 ，op 字 段 具 有 值 “i”， 图 5-24 中 第 (1) 行 的 测试 会 成 功 , 第 (2) 行 会 返 
回 操作 数 的 值 。 

归纳 。 假 设 节 点 xz 不 是 〈 指 向 ) 叶子 节点 (的 指针 )。 归 纳 假设 就 是 ，S(7') 以 n 的 茶 个 子 方 
点 为 根 节 点 的 每 棵 树 刀 都 为 真 。 必 须 使 用 这 一 推理 证 明 S(T) 对 以 n 为 根 方 点 的 树 7 成立 。 

因为 假设 运算 符 部 是 二 元 的 ， 所 以 n 有 两 棵 子 树 。 根 据 归 纳 假设 ,第 (3) 行 和 第 (4) 行 计算 出 
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vall 和 va12 的 值 ， 分 别 是 左 子 树 和 右 子 树 的 值 。 图 5-25 展 示 了 这 两 棵 子 树 ，val1l 存 放 着 7 的 
值 ，val12 存 放 着 胞 的 值 。 





Ze 


图 $-25 ”调用 eval(n) 返 回 7 和 的 值 的 和 


如 有 果 看 看 第 (5) 行 到 第 (9) 行 的 switch 语 句 ， 就 会 发 现 不 管 根 节 点 n 处 出 现 什 么 运算 符 ， 它 者 
会 被 应 用 到 val1 和 val12 这 两 个 值 上 。 例 如 ， 如 果 根 节点 处 存放 着 +， 如 图 5-25 所 示 ， 那 么 第 (3) 
行 返 回 的 值 就 是 vall+val2， 正 如 这 应 该 是 树 九 和 到 对 应 表达 式 的 和 。 现 在 就 完成 了 归纳 步骤 。 

因此 可 以 得 出 S(T) 对 所 有 的 表达 式 树 7 都 成 立 的 结论 , eval 函 数 能 正确 地 求 出 表示 表达 式 
的 树 的 值 。 


+ 示例 5.18 
现在 来 考虑 一 下 图 $-22 中 的 computeHL 了 图 数 ， 图 $-26 重 现 了 该 函数 的 图 数 体 。 该 函数 接受 
(指向 ) 节点 n( 的 指针 ) 作为 参数 ， 并 计算 n 的 高 度 。 我 们 将 通过 结构 归纳 法 证 明 以 下 命题 。 





n->height = 0; 

c = n->leftmostChild; 

while (c != NULL) { 
computeHt (c); 


if (c->height >= n->height) 
n->height = i+c->height; 
C = c->rightSibling; 


} 





图 5-26 ”图 5-22 中 computeHt (n) 函数 的 函数 体 


命题 S(T) 。 在 对 指向 树 7 根 节点 的 指针 调用 computeHt 时 ，7 中 每 个 节点 的 正确 高 度 都 会 
被 存储 在 该 节点 的 height 字 上段 中 。 

依据 。 如 果树 T 只 有 一 个 节点 a， 那么 在 图 5-26 中 的 第 (2) 行 ，c 会 被 赋 上 NULL 值 ， 因 为 n 没 有 
子 节 点 。 因 此 ， 第 (3) 行 的 测试 会 立即 失败 ， 而 且 whi1le 循 环 的 循环 体 永远 都 不 会 执行 。 因 为 第 
(1) 行 会 将 n->heignt 置 为 0 (这 对 叶子 节点 而 言 是 正确 的 值 )， 所 以 可 以 得 出 结论 ， 当 7 只 有 一 
个 节点 时 S(T) 成 立 。 

归纳 。 现在 假设 n 是 有 多 个 节点 的 树 7 的 根 节点 , 那么 n 至 少 有 一 个 子 节 点 。 我 们 可 以 在 归纳 
假设 中 假定 ， 在 第 (4) 行 调用 computeHt (c) 时 ， 以 c 为 根 节点 的 子 树 中 每 个 节点 (包括 c 本 身 ) 
的 height 字 段 中 都 被 法 入 了 正确 的 高 度 。 现 在 需要 证 明 ， 第 (3) 行 到 第 (7) 行 的 while 循 环 可 以 
正确 地 将 n->height 置 为 比 z 的 子 节 点 的 最 大 高 度 大 1。 要 做 到 这 一 点 , 就 需要 执行 另 一 次 归纳 ， 
这 是 瞬 套 在 该 结构 归纳 法 证 明 过 程 中 的 ， 就 像 是 程序 中 循环 藤 套 在 另 一 个 循环 中 那样 。 该 归纳 
使 用 的 是 “普通 的 ”归纳 法 而 不 是 结构 归纳 法 ， 它 的 命题 如 下 。 
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命题 5$'(i) 。 在 第 G3) 到 第 (7) 行 的 循环 执行 次 之 后 , n->height 的 值 要 比 z 前 从 子 节点 的 最 
大 高 度 大 1。 

依据 。 依 据 是 ;= 1 的 情况 。 因 为 n->height 在 循环 外 一 一 第 (1]) 行 一 一 会 被 置 为 0， 并 且 肯 
定 不 会 有 比 0 还 小 的 高 度 ， 所 以 第 (5) 行 的 测试 会 得 到 满足 。 第 (6) 行 就 会 将 n->height 置 为 比 n 
的 第 一 个 子 节 点 的 高 度 大 1。 

归纳 。 假设 5') 为 真 。 也 就 是 说 ， 在 循环 的 迭代 次 之 后 , n->heignt 会 比 前 ;个 子 贡 点 的 
最 大 高 度 大 1。 如 果 有 第 ;+1 个 子 节 点 , 那么 第 (3) 行 的 测试 会 成 功 , 而 且 会 第 i+1 次 执行 循环 体 。 
第 (5) 行 的 测试 会 将 新 的 高 度 与 之 前 的 最 大 高 度 相 比较 。 如 果 新 高 度 c->height 比 前 i 个 高 度 中 
最 大 值 加 1 要 小 ， 就 不 用 对 n->height 进 行 任何 改变 。 这 是 对 的 ， 因 为 前 i+1 个 子 市 点 的 最 大 
高 度 是 可 以 与 前 个子 三 点 的 最 大 高 度 相同 的 。 不 过 ， 如 果 新 的 高 度 比 之 前 的 最 大 值 大 ， 第 (5) 
行 的 测试 驶 会 成 功 ， 这 样 n->height 就 会 被 置 为 比 第 ;+1 个 子 节 点 的 高 度 大 1， 这 是 正确 的 。 

现在 可 以 回 到 结构 归纳 了 。 当 第 (3) 行 的 测试 失败 时 ， 就 已 经 考虑 过 z 的 所 有 子 节 点 了 。 内 
层 的 归纳 5'G) 说 明 ， 当 子 节点 的 总 数 为 1H 时，n->height 要 比 n 各 子 节点 的 最 大 高 度 大 1。 这 就 
是 zx 的 正确 高 度 。 将 归纳 假设 应 用 于 mx 的 各 子 节 点 ， 就 得 到 结论 : 正确 的 高 度 已 经 存储 到 每 个 子 
节点 的 height 字 段 中 。 因 为 已 经 得 知 z 的 高 度 也 已 经 正确 地 计算 出 来 ， 所 以 可 以 得 出 结论 : 7 
中 所 有 节点 都 被 版 上 了 它们 正确 的 高 度 值 。 

现在 已 经 完成 了 结构 归纳 法 的 归纳 步骤 , 并 得 出 结论 : 对 每 棵 树 调 用 computeHt 都 可 以 正 
确 地 计算 树 中 每 个 节点 的 高 度 。 


才 陪 























结构 归纳 法 的 模板 


下 面 简 述 了 进行 正确 的 结构 归纳 法 证 明 的 过 程 。 

(1) 指定 要 证 明 的 命题 S(T) ， 其 中 7 是 一 棵 树 。 

(2) 证 明 依 据 ， 也 就 是 只 要 7 是 一 棵 单 节 点 的 树 ，S(7T) 就 为 真 。 

(3) 建立 归纳 步骤 ,， 设 T 是 以 /为 根 节点 的 树 ， 而且 有 三 1 棵 子 树 ， 分 别 为 Ti、TD、…、Ti。 
表示 假定 有 归纳 假设 ， 即 S(T) 对 每 哥 子 树 T (i=1]、2、…、k) 都 为 真 。 

(4) 证 明 在 (3) 中 提 到 的 假设 下 S(T) 为 真 。 





5.5.1 结构 归纳 法 为 何 有 效 


要 说 明 结 构 归 纳 法 为 何 是 一 种 有 效 的 证 明 方法 , 其 原因 与 普通 归纳 法 有 效 的 原因 类 似 : 如 
果 结 论 为 假 , 那么 就 会 有 个 最 小 的 反例 , 而 且 该 反例 既 有 可 能 违背 依据 , 也 可 能 违背 归纳 过 程 。 
也 就 是 说 ,假设 有 命题 S(T) ， 已 经 证 明了 它 的 依据 和 结构 归纳 步 又， 而 存在 一 棵 树 或 多 棵 树 
可 以 让 5 为 假 。 设 Th 是 可 以 让 S(T) 为 假 的 这 样 一 棵 树 ， 并 设 7 与 让 5 为 假 的 任 一 棵 树 的 节点 一 
样 少 。 

有 两 种 情况 。 第 一 种 ,假设 7 由 单个 节点 组 成 。 那 么 根据 依据 ， 有 S(7,) 为 真 ， 所 以 这 种 情 
况 不 可 能 发 生 。 

现在 就 只 剩 下 TH 有 多 个 市 点 的 情况 了 ， 这 里 假设 0 有 m 个 证 点 ， 那 么 To 就 是 由 根 节 点/ 与 一 
个 或 多 个 子 节点 构成 。 设 以 这 些 子 节点 为 根 的 树 分 别 是 九 、 到 、…、Te 这 里 可 以 声明 娓 、 妈 、…、 
的 三 点 数 均 不 超过 m - 1。 因 为 如 果 菏 棵 树 (假如 是 7 ) 的 节点 数 达 到 或 超过 关 ， 那 么 由 到 (可 
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能 还 有 其 他 子 树 ) 和 根 节 点 /组 成 的 7 就 至 少 会 有 六 + 1 个 节点 。 这 与 7 刚好 有 mm 个 节点 的 假设 是 
下 导 的 。 

因为 T、、…、Ti 这 些 子 树 的 厄 点 数 都 不 超过 m 一 1, 所 以 就 可 以 知道 这 些 树 都 不 能 违背 9， 
因为 选择 了 Th 是 让 5 为 假 的 最 小 子 树 。 因 此 可 知 S(CT)、S( 有 HD) 、…、S(ZT) 都 为 真 。 而 假设 已 经 
得 到 证 明 的 归纳 步骤 说 明了 S(T) 也 为 真 ， 这样 义 与 To 违背 5 的 假设 产生 了 矛盾 。 

在 考虑 完 这 两 种 可 能 的 情况 后 ,我们 就 知道 : 不 管 一 棵 树 只 有 一 个 节点 还 是 有 多 个 节点 ， 
Th 都 不 可 能 是 5 的 例外 。 因 为 5 是 没有 例外 的 ， 所 以 S(T) 一 定 对 所 有 的 树 7 都 为 真 。 


5.5.2 习题 


(1) 通过 结构 归纳 法 证 明 : 
(a) 图 5-15 的 前 序 遍 历 函 数 会 以 前 序 打印 出 树 的 标号 ; 
(b) 图 $-17 中 的 后 序 函 数 会 以 后 序列 出 标号 。 
(2) * 假设 分 支 系 数 为 5 的 单词 查找 树 是 用 具有 图 5-6 中 所 示 格 式 的 节点 表示 的 。 用 结构 归纳 法 证 明 : 











如 果树 TH 有 nn 个 节点 ， 那 么 它 的 节点 中 有 1+ (5 一 Dn 个 NULL 指 针 。 那 么 ,共有 多 少 非 NULL 指 针 ? 
(3)* 节点 的 度 是 指 节点 所 具有 的 子 节点 的 数目 。 "用 结构 归纳 法 证 明 : 在 任意 树 7 中 ， 节 点 的 数目 都 
要 比 节 点 的 度 之 和 大 1。 








(4)* 用 结构 归纳 法 证 明 : 在 任意 树 7 中 ， 叶 子 节 点 的 数目 都 要 比 具有 右 兄 弟 节 点 的 节点 的 数目 大 1。 

(5) * 用 结构 归纳 法 证 明 : 在 任意 用 最 左 子 节点 右 兄 第 节点 的 数据 结构 表示 的 树 7? 中 ，NULL 指 针 的 数 
目 都 要 比 节 点 的 数目 大 1。 

(6)* 在 5.2 节 开始 的 部 分 ， 我 们 给 出 了 树 的 递归 定义 和 非 递归 定义 。 使 用 结构 归纳 法 证 明 : 每 棵 以 递 
归 方式 定义 的 树 在 非 递归 定义 下 也 是 同样 的 树 。 

(7) ** 证 明 习 题 (6) 的 逆 命 题 : 每 棵 以 非 递 归 方 式 定义 的 树 在 以 递归 方式 定义 时 也 是 相同 的 树 。 








树 的 归纳 的 谬误 形式 


我 们 常常 会 想 着 对 树 的 节点 数 进行 归纳 ， 就 是 假设 命题 对 具有 1 个 节点 的 树 成 立 ， 并 证 明 它 对 具有 
n+1 个 节点 的 树 也 成 立 。 如 果 不 够 谨慎 ， 就 很 可 能 作出 这 种 荒 雇 的 证 明 。 

在 第 2 章 中 对 整数 进行 归纳 证 明 时 , 我 们 提出 了 一 种 合理 的 方法 , 就 是 试 着 用 S(n) 证 明 命题 Sm +D) ， 
并 称 这 种 方法 为 “后 靠 ”。 有 时 候 有 人 可 能 把 这 一 过 程 看 作 从 S(n) 开始 并 证 明 S(n+1), 称 这 种 方法 为 “前 
推 。 在 整数 的 情况 下 ,这 基本 上 是 相同 的 意思 。 不 过 ， 对 树 而 言 ， 我 们 不 能 先 假 设 命题 对 具有 nn 个 节点 
的 树 成 立 ， 并 在 茶 个 位 置 加 上 一 个 节点 ， 然 后 就 说 证 明了 结果 对 所 有 具有 n+1 个 节点 的 树 都 成 立 。 

例如 ， 声明 S(n) : “所 有 有 具有 nn 个 节点 的 树 都 有 一 条 长 度 为 n 一 1 的 路 径 。”n=1 的 依据 情况 显然 为 
真 。 在 错误 的 “归纳 ”中 ， 可 能 会 作出 如 下 论证 : “假设 有 一 棵 具有 n 个 节点 的 树 T7， 它 有 一 条 长 n 一 1 的 
路 径 ， 假如 说 是 到 节点 vy 的 。 给 Vv 加 上 子 节点 u。 现在 就 有 了 一 棵 具有 n+1 个 节点 的 树 ,， 而 且 它 有 一 条 长 度 
为 n 的 路 径 ， 这 样 就 证 明了 归纳 步骤 。” 

当然 ， 上 述 论证 是 裹 误 的 ， 因 为 它 没有 证 明 结 果 对 所 有 具有 n+1 个 节点 的 树 都 为 真 ， 而 只 是 证 明了 
对 选 出 的 一 些 树 为 真 。 正确 的 证 明 不 能 是 从 n 个 节点 “前 推 ” 到 n+1 个 节点 ， 因 为 我 们 不 会 从 这 一 过 程 得 
出 所 有 可 能 的 树 。 我 们 必须 从 任意 具有 7+1 个 节点 的 树 开 始 “ 后 靠 ”， 小 心地 选 出 一 个 节点 ， 并 将 其 删 
除 ， 从 而 得 到 一 棵 具有 1 个 节点 的 树 。 








J 分 文系 数 和 度 是 相关 的 概念 ， 但 它们 是 不 同 的 ， 分 支 系数 是 树 中 各 节点 度 的 最 大 值 。 
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5.6 ”二叉树 

本 三 展现 了 男 一 种 树 一 一 二 又 树 ， 它 和 5.2 节 介绍 的 “普通 ” 树 是 不 同 的 。 在 二 又 树 中 ， 市 
所 最 多 有 两 个 子 方 点 ,而且 并 不 是 自然 地 从 左 起 为 子 市 点 计数 ,而 是 有 两 个 “ 柳 ”"， 其 中 一 个 用 
来 存放 左 子 方 点 ,为 一 个 用 来 存放 右 子 三 点 。 这 两 个 槽 中 可 能 有 一 个 为 空 , 也 可 能 两 个 都 为 空 。 


图 5-27 两 棵 各 只 有 两 个 方 点 的 二 又 树 











+ 示例 5.19 

图 5-27 展 示 了 两 棵 二 叉 树 。 它 们 均 以 1 为 根 节点 。 第 一 棵 树 以 mn) 为 左 子 节点 , 且 没 有 右 子 节 
点 。 而 第 二 棵 树 则 没有 左 子 节点 ，ns 是 其 根 节点 的 右 子 节点 。 在 这 两 棵 树 中 ，ns 都 是 既 没 有 左 
子 节点 也 没有 右 子 节点 。 它 们 均 为 只 有 两 个 节点 的 二 叉 树 。 

接 下 来 将 按照 如 下 方式 递归 地 定义 二 又 树 。 

依据 。 空 树 是 二 又 树 。 

归纳 。 如 果 ; 是 节点 ， 而 且 九 和 有 都 是 二 又 树 ， 那 么 以 为 根 节点 ， 了 为 左 子 树 ， 了 为 右 子 树 
可 以 组 成 一 棵 二 叉 树 ， 如 图 5-28 所 示 。 也 就 是 说 ,TT 的 根 节点 就 是 x 的 左 子 节点 ,除非 7 是 空 树 ， 
因为 这 种 情况 下 x 没有 左 子 节点 。 同 样 地 ,的 根 节点 是 x 的 右 子 节点 ,除非 用 是 空 树 ， 因 为 这 种 
情况 下 x 没有 右 子 节点 。 





Za 


图 5-28 二叉树 的 递归 定义 


5.6.1 二 又 树 的 术语 


5.2 证 引入 的 路 径 、 祖 先 和 子孙 的 概念 也 适用 于 二 叉 树 。 也 就 是 说 ， 左 子 节点 和 右 子 市 点 都 
归 为 “ 子 节 点 ”。 路 径 仍 然 是 节点 my、m2、…、mx 按 照 mai 是 mi ( i=1,2,…, -1 ) 的 ( 左 或 右 ) 
子 市 点 的 方式 串联 起 来 的 序列 。 这 条 路 径 称 为 从 m1 到 mi 的 路 径 。k =1 的 情况 也 是 可 以 的 ,这样 
的 话 路 径 上 就 只 有 一 个 节点 。 

如 果 某 个 节点 存在 两 个 子 节 点 ， 那 么 这 两 个 子 节 点 就 互 为 兄弟 节点 。 叶 子 节点 是 指 既 没有 
左 子 节点 也 没有 右 子 节点 的 节点 ， 还 可 以 认为 叶子 节点 是 左 子 树 和 右 子 树 都 为 空 树 的 节点 。 内 
部 市 点 则 指 不 是 叶子 节点 的 节点 。 
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路 径 长 度 、 高 度 和 深度 的 定义 与 普通 的 树 是 完全 相同 的 ,二 又 树 路 径 的 长 度 要 比 节 点 数 小 1， 
也 就 是 说 ， 长 度 就 是 路 径 上 父子 关系 对 的 数量 。 市 点 n 的 高 度 是 指 n 到 其 子孙 叶子 方 点 最 长 路 答 
的 长 度 。 二 又 树 的 高 度 就 是 其 根 节 点 的 高 度 。 节 点 7 的 深度 是 指 从 根 节 点 到 z 的 路 径 的 长 度 。 


+ 示例 5.20 

图 5-29 展 示 了 具有 3 个 节点 的 二 义 树 可 能 形成 的 5 种 形状 。 在 图 5$-29 所 示 的 每 棵 二 又 树 中 ， 
3 都 是 nn1 的 子孙 ， 并 存在 从 nn1 到 ns 的 路 径 。 13 在 每 棵 树 中 都 是 叶子 节点 ， 而 在 中 间 那 棵 树 中 是 
叶子 节点 ， 在 其 他 4 棵 树 中 都 是 内 部 节点 。 

3 在 每 棵 树 中 的 高 度 部 为 0, ni 除了 在 中 间 那 棵 树 的 高 度 为 1 之 外 , 在 其 他 树 中 的 高 度 都 为 2。 
每 棵 树 的 高 度 都 与 在 那 棵 树 中 的 高 度 一 致 。 广 点 除了 在 中 间 那 棵 树 的 深度 为 1 之 外 ， 在 其 他 
树 中 座 度 都 为 2。 


图 5-29 具有 3 个 市 点 的 5 种 二 又 树 














(普通 ) 树 和 二 叉 树 的 区 别 


尽管 二 又 树 要 求 区 分 子 节 点 是 左 子 节点 还 是 右 子 节 点 , 但 普通 的 树 却 没有 这 样 的 限制 , 理 
解 这 一 点 是 很 重要 的 。 也 就 是 说 ， 二 又 树 不 仅 是 节点 的 子 节点 数 全 都 不 多 于 两 个 的 树 。 图 5-27 
中 的 两 哥 树 不 仅 是 互 不 相同 ， 而 且 与 由 根 节点 及 根 节 点 的 子 节 点 组 成 的 如 下 普通 树 也 没有 


@ 
人 


这 里 还 存在 一 个 技术 上 的 区 别 。 尽 管 树 的 定义 中 表示 树 至 少 有 一 个 节点 ， 但 二 叉 树 中 可 以 存在 
空 树 ， 也 就 是 没有 节点 的 树 。 





5.6.2 二 又 树 的 数据 结构 


有 一 种 很 自然 的 方式 可 以 用 于 表示 二 又 树 。 节 点 可 以 表示 为 具有 leftchild 和 
rightchilgd 这 两 个 分 别 指向 左 子 节 点 和 右 子 节 点 的 字段 的 记录 。 出 现在 这 两 个 字段 中 的 NULL 
指针 就 表示 对 应 的 左 子 树 或 右 子 树 为 空 一 一 也 就 是 说 节 点 没有 左 子 节点 或 右 子 节点 。 

二 义 树 可 以 表示 为 指向 其 根 节 点 的 指针 。 空 二 叉 树 很 自然 地 就 被 表示 为 NULL。 因 此 ,如 下 
类 型 定义 就 表示 二 义 树 。 
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typedef struct NODE *TREE; 
struct NODE { 

TREE leftChild, rightChild; 
}; 


在 这 里 ,“ 指 向 节点 的 指针 ”类 型 名 为 TREE， 因 为 这 一 类 型 最 常见 的 用 途 就 是 表示 树 和 子 
树 。 我 们 既 可 以 将 leftchilgd 和 rightchi1d 字 上 段 解释 为 指 问 子 节点 的 指针 , 也 可 以 将 其 解释 
为 指向 左右 子 树 本 身 的 指针 。 

此 外 ， 还 可 以 为 表示 NODE 的 结构 体 添 加 标号 字段 ， 并 (或 ) 可 以 添加 指向 父 节 点 的 指针 。 
请 注意 ， 父 指针 的 类 型 是 *xNODE， 或 是 TREE 的 等 价 类 型 。 


5.6.3 ”对 二 叉 树 的 递归 


有 很 多 针对 二 义 树 的 目 然 算法 可 以 通过 递归 的 方式 来 定义 。 这 里 递归 的 模式 要 比 图 5-13 中 
普通 树 的 递归 模式 更 具 局 限 性 , 因为 操作 只 能 发 生 在 左 子 树 被 探索 之 前 、 两 棵 子 树 的 探索 之 间 ， 
或 是 两 棵 子 树 都 探索 完 之 后 。 对 二 又 树 进 行 递归 的 模式 如 图 5-30 所 示 。 



























































{ 
action Ao; 
对 左 子 树 的 递归 调用 ; 
action Ai; 
对 右 子 树 的 递归 调用 ; 


action A,; 





} 





图 5-30 ”二 又 树 递归 算法 的 模板 


+ ”示例 5.21 

具有 二 元 运算 符 的 表达 式 树 可 以 用 二 叉 树 表 示 。 这 些 二 叉 树 是 很 特殊 的 ， 因 为 节点 要 么 有 
两 个 子 节点 ， 要么 就 没有 子 节 点 (一 般 而 言 ,二叉树 可 以 有 只 有 一 个 子 节 点 的 节点 ), 例如， 图 
5-31 重 现 了 图 5-14 中 的 表达 式 树 ， 这 棵 表达 式 树 可 以 视 作 二 又 树 。 








图 5-31 由 二 叉 树 表 示 的 表达 式 a+ (bp 一 c)*d 
假设 为 节点 和 树 定 义 如 下 类 型 . 


typedef struct NODE *TREE; 
struct NODE { 

char nodeLabel; 

TREE leftChild, rightChild.; 
}; 
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那么 图 5-32 就 展示 了 用 来 以 前 序列 出 二 义 树 7 中 各 节点 标号 的 递归 函数 。 


void Preorder(TREE t) 
{ 
if (t != NULL) { 
printf("%c\n", t->nodeLabel); 


preorder(t->leftChild); 
preorder (t->rightChild); 


} 





图 5-32 ”二 又 树 的 前 序 排列 


该 函数 的 行为 与 图 5-15 中 用 于 处 理 普 通 树 的 同名 函数 相似 。 主 要 区 别 在 于 ， 当 图 5-32 中 的 
函数 遇 到 叶子 节点 时 ， 它 会 对 ( 缺失 的 ) 左右 子 节 点 调用 上 自身。 这 些 调 用 会 立即 返回 ， 因 为 当 ; 
为 NULL 时 ， 整 个 函数 体 只 有 第 (1) 行 的 测试 会 执行 。 如 果 将 图 5-32 中 的 第 (3) 行 和 第 (4) 行 替换 为 : 

(3) if (t->leftChild != NULL) preorder(t->leftChild); 

(4) if (t->rightChild != NULL) preorder(t->rightChild); 

就 可 以 多 节省 一 些 调用 。 不 过 ,这样 就 不 能 防止 其 他 函数 以 NULL 为 参数 调用 preorder 了。 因 
此 ， 为 了 安全 起 见 ， 要 保留 第 (1) 行 的 测试 。 








5.6.4 习题 


(1) 编写 函数 ， 使 其 能 打印 出 二 叉 树 节点 〈 标 号 ) 的 中 序 排列 。 假 设 这 些 节 点 是 用 如 本 节 所 描述 那样 
具有 左 子 节点 和 右 子 节点 指针 的 记录 表示 的 。 

(2) 编写 函数 ， 使 其 接受 二 又 表达 式 树 ， 并 打印 出 它 所 表示 的 表达 式 带 有 全 部 括号 的 版 本 。 假 设 这 里 
使 用 了 与 习题 (1) 相 同 的 数据 结构 。 

(3) * 重复 习题 (2), 但 只 打印 所 需 的 括号 ,假设 这 里 使 用 的 是 常用 的 算术 运算 符 优先 级 和 结合 性 。 

(4) 编写 函数 ， 使 其 能 得 出 二 又 树 的 高 度 。 

(5) 如 果 二 又 树 的 节点 同时 具有 左 子 节点 和 右 子 节点 , 那么 就 说 该 节点 是 完全 的 。 用 结构 归纳 法 证 明 : 
二 叉 树 中 完全 节点 的 数量 ， 要 比 叶 子 节点 的 数量 少 1。 

(6) 假设 用 左 子 节 点 右 子 节 点 记录 类 型 表示 二 又 树 。 用 结构 归纳 法 证 明 : NULI 指 针 的 数量 要 比 节点 的 
数量 大 1。 

(7) ** 树 可 以 用 来 表示 递归 调用 。 每 个 节点 都 表示 某 个 函数 F 的 一 次 递归 调用 ， 而 其 子 节点 则 表示 FF 


执行 的 调用 。 在 本 题 中 ， 要 考虑 对 45 节 给 出 的 | ”| 进行 闻 归 ， 根 据 的 圳 归 关 系 是 











国 和 | [7 。 每 次 调用 都 可 以 用 一 棵 二 又 树 表 示 。 如 果 某 个 节点 对 应 着 辐 的 计算 ， 
而 且 不 属于 依据 情况 ( m=0 和 m= ) ,那么 其 左 子 节点 就 表示 | , 而 右 子 节点 表示 四 
如 果 该 节点 表示 的 是 依据 情况 ， 那 么 它 就 既 没有 左 子 节点 ， 也 没有 右 子 节点 。 
(a) 通过 结构 归纳 法 证 明 : 根 届 点 对 应 着 | | 的 三 又 柚 刚好 有 | | 


n n 
m m 





(b) 利用 (证 明 ， |] 对 北上 和 法 的 运 和 事件 是 中 请 注意 ， 该 运行 时 间 因此 也 就 是 


0O(2") ， 不 过 后 者 是 平 请 但 非 紧 边界 。 
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中 序 遍 历 


除了 二 又 树 的 前 序 排 列 和 后 序 排 列 外 ， 二 叉 树 就 只 有 一 种 有 意义 的 节点 排列 方式 了 。 在 二 又 树 中 ， 
探索 完 左 子 树 之 后 ,而 在 探索 右 子 树 之 前 ( 即 图 5-30 中 操作 TT 的 位 置 ) 列 出 每 个 节点 ， 这 样 就 形成 了 二 又 
树 节点 的 中 序 排列 。 例 如 ， 在 图 5-31 所 示 的 树 中 ， 中 序 排列 就 是 at+b-cxd 。 

对 表示 表达 式 的 二 又 树 进行 前 序 人 遍历, 得 到 的 就 是 该 表达 式 的 前 级 形式 ,对 同样 的 树 进行 后 序 遍 历 ， 
则 会 得 到 表达 式 的 后 缓 形式 。 而 中 序 遍 历 则 几乎 会 产生 原始 的 ， 或 者 说 是 中 缓 形式 的 表达 式 ， 不 过 该 表 
达 式 是 没有 括号 的 。 也 就 是 说 ， 图 5-31 中 的 树 表示 的 表达 式 a+(p 一 c)*dqd 与 其 中 序 排列 Ga+D--cxa 是 不 
同 的 ， 差 别 只 是 后 者 中 少 了 必要 的 括号 而 已 。 

要 确保 所 需 的 括号 出 现 ， 可 以 为 所 有 的 运算 符 加 上 括号 。 在 这 种 修改 后 的 中 序 遍 历 中 ， 在 探索 左 子 
树 之 前 执行 的 操作 40， 会 检查 节点 的 标号 是 否 为 运算 符 ， 而 有 全， 如 果 是 运算 符 的话 ， 就 会 打印 “(”， 也 
就 是 左 括号 。 同 样 地 ， 如 果 标 号 是 运算 符 ， 探 索 完 两 棵 子 树 后 执行 的 操作 42? 就 会 打印 右 括号 “)”。 将 该 
规则 应 用 于 图 5-31 所 示 的 二 又 树 , 得 到 的 结果 会 是 (a+((b 一 c)*d)) ,这 就 有 了 bc 两 侧 一 对 必要 的 括号 ， 
以 及 两 对 多 余 的 括号 。 








对 二 叉 树 进行 结构 归纳 


与 普通 树 一 样 ， 结 构 归 纳 法 也 适用 于 二 又 树 。 其 实 还 可 以 使 用 更 简单 的 模式 ， 这 种 模式 下 的 依据 是 
空 树 。 下 面 就 是 对 这 一 技巧 的 总 结 。 

(1) 指定 要 证 明 的 命题 S(T) ， 其 中 7 是 一 棵 二 又 树 。 

(2) 证 明 依据 ， 即 证 明 若 7 是 空 树 ， 则 S(T) 为 真 。 

(3) 设 7 是 以 为 根 节 点 ， 并 以 九 和 罗 为 子 树 的 二 又 树 ， 以 此 构建 归纳 步骤。 声明 假定 有 归纳 假设 ， 即 
S(T1) 和 S(TR) 为 真 。 

(4) 在 (3) 中 提 到 的 假设 下 证 明 S(T) 为 真 。 





5.7 二 又 查找 树 


各 种 计算 机 程序 中 有 一 种 同样 的 活动 ， 就 是 维护 这 样 一 组 值 ， 用 户 希 望 : 

(1) 回 这 组 值 中 插入 元 素 ; 

(2) 从 这 组 值 中 删除 元 素 ; 

(3) 查找 某 元 素 ， 看 看 它 是 否 在 这 组 值 中 。 
例子 之 一 是 英语 词典 ， 我 们 时 不 时 地 会 往 里 面 插入 一 些 新 单词 ， 比 如 fax; 删除 一 些 不 再 使 用 
的 单词 ， 比 如 aegilops; 或 者 是 要 查找 一 串 字 母 ， 看 看 其 是 否 为 单词 ， 例 如 ， 这 是 拼写 检查 
器 程序 的 一 部 分 。 

因为 这 个 例子 是 我 们 非常 熟悉 的 ， 所 以 不 管 其 具体 用 途 是 什么 ， 只 要 是 可 以 按照 上 述 定义 
对 其 执行 插入 、 删 除 和 查找 操作 的 一 组 值 ， 都 叫 作 词典 。 再 举 个 词典 的 例子 ， 某 教授 可 能 要 记 
录 选 修 某 课程 学 生 的 花 名 册 。 偶 尔 会 有 学 生 被 加 入 这 门 课 程 (插入 ), 或 是 退出 该 课程 (删除 )， 
是 需要 和 弄 清 某 个 学 生 是 否 选 修了 该 课程 ( 查找 )。 
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二 叉 查 找 树 这 种 这 标 号 的 二 又 树 是 实现 词典 的 一 个 好 方法 。 假设 市 点 的 标号 是 按照 “小 于 ” 
顺序 ( 我们 会 将 其 写作 < ) 从 一 组 值 中 选 出 的 。 例 子 包括 具有 一 般 小 于 顺序 的 实数 或 整数 ， 或 
是 有 着 用 < 表示 的 词典 顺序 或 字母 表 顺 序 的 字符 串 。 

二 又 查找 树 ( Binary Search Tree，BST ) 是 一 种 带 标 号 的 的 二 又 树 , 以 下 属性 对 这 种 二 又 树 
的 每 个 节点 x 都 成 立 : x 的 左 子 树 中 所 有 节点 的 标号 都 小 于 x 的 标号 ， 而 其 右 子 树 中 所 有 节点 的 标 
号 都 大 于 x 的 标号 。 这 种 属性 被 称 为 二 又 查找 树 属性 。 

+ 示例 5.22 

图 5-33 展 示 了 对 应 着 集合 1 Hairy, Bashful, Grumpy, Sleepy, Sleazy, Happy | 
的 二 义 查 找 树 ， 其 中 < 顺序 是 词典 顺序 。 请 注意 ， 根 节点 左 子 树 在 词典 顺序 上 都 小 于 Hairy， 
而 右 子 树 在 字典 顺序 上 都 大 于 它 。 这 一 属性 对 该 树 中 的 每 个 节点 都 成 立 。 


Hairy 


FP a 
% / 


Grumpy Sleazy 


/ 


Happy 
图 5-33 ”具有 6 个 带 字 符 串 标 号 的 节操 的 二 又 查找 树 


5.7.1 用 二 叉 查 找 树 实现 词典 
我 们 可 以 将 二 又 查找 树 表 示 为 任何 带 标号 的 二 又 树 。 例 如 , 可 以 按 如 下 形式 定义 NODE 


typedef struct NODE *TREE; 
struct NODE { 

ETYPE elLement ; 

TREE leftChild, rightChild; 
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}; 

二 又 查 找 树 被 表示 为 指向 二 又 查找 树 根 节点 的 指针 。 元 素 的 类 型 BTYPE 应 该 得 到 合理 的 设 
置 。 在 本 章 所 有 的 程序 中 ， 都 将 假设 BTYPE 为 int 类 型 ， 从 而 使 元 素 间 的 比较 可 以 直接 用 算术 
比较 运算 符 <、== 和 > 完成 。 在 涉及 词典 顺序 比较 的 例子 中 ， 可 以 假设 程序 中 的 比较 由 诸如 2.2 
节 中 讨论 过 的 IL、eq 和 et 这 样 的 比较 函数 完成 。 


5.7.2 ”二 义 查 找 树 中 元 素 的 查找 


假设 想 在 由 二 又 查找 树 7 表示 的 某 词典 中 查找 菏 个 元 紊 x。 如 有 果 将 x 与 7 的 根 节 点 处 的 元 素 加 
以 比较 ,就 可 以 利用 二 又 查找 树 属 性 快速 找到 x， 或 确定 x 没有 出 现 。 如 果 x 在 根 节 点 处 ,就 完成 
了 查找 。 否 则 ， 如 果 x 比 根 节 点 处 的 元 素 小 ，x 就 只 可 能 在 左 子 树 中 被 找到 ( 根据 二 又 查找 树 属 
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性 )， 而 如 果 x 比 根 节点 处 的 元 素 大 ，x 就 只 可 能 出 现在 右 子 树 中 (还 是 因为 二 又 查找 树 属性 )。 
也 就 是 说 ， 可 以 通过 以 下 递归 算法 表示 查找 操作 。 
依据 。 如 果树 7 是 空 树 ， 那 么 x 未 出 现 。 如 果树 7 非 空 ， 而 且 x 在 根 节点 ， 那 么 x 就 出 现 了 。 
归纳 。 如 果 7 绯 空 而 x 未 在 根 节 点 位 置 ， 设 ?是 7 根 节 点 处 的 元 素 。 如 果 x<y ， 则 只 在 根 节 点 
的 左 子 树 中 查找 x; 如 果 x 二 y ， 则 只 在 y 的 右 子 树 中 查找 x。 二 又 查找 树 属性 保证 x 不 可 能 出 现在 
没有 查找 的 那 棵 子 树 中 。 








抽象 数据 类 型 


诸如 插入 、 删 除 和 查找 这 种 可 能 对 一 组 对 象 或 特定 类 别 执行 的 一 系列 操作 ， 有 时 称 为 抽象 
数据 类 型 或 ADT。 这 一 概念 也 会 被 称 为 类 或 模块 。 我 们 将 在 第 7 章 中 研究 若干 抽象 数据 类 型 ， 
而 在 本 章 中 ， 我 们 会 看 到 其 中 一 个 : 优先 级 队列 。 

ADT 可 以 有 多 种 抽象 实现 。 例 如 , 在 本 节 中 可 看 到 二 又 查找 树 是 一 种 实现 词典 ADT 的 好 方 
法 。 表 是 另 一 种 看 似 可 靠 实则 经 常 效 率 低 下 的 实现 词典 ADT 的 方式 。7.6 节 将 介绍 散 列 ， 另 一 
种 不 错 的 词典 实现 方式 。 

每 种 抽象 实现 依次 可 通过 若干 种 不 同 的 数据 类 型 来 具体 实现 。 举例 来 说 ,可 以 使 用 二 又 树 
的 左 子 节点 右 子 节点 实现 作为 实现 二 又 查找 树 的 数据 结构 。 这 一 数据 结构 ， 加 上 用 于 插入 、 册 
除 和 查找 的 恰当 函数 ， 就 成 了 词典 ADT 的 一 种 实现 。 

在 程序 中 使 用 ADT 的 一 个 重要 原因 是 ，ADT 底 层 的 数据 只 能 通过 ADT 的 操作 ( 比如 插入 ) 
来 访问 。 这 一 限制 是 防御 性 编程 的 一 种 形式 ,可 以 防止 操作 数据 的 函数 以 意料 之 外 的 方式 对 数 
据 进 行 偶发 变更 。 使 用 ADT 的 第 二 个 重要 原因 在 于 , ADT 让 我 们 可 以 重新 设计 数据 结构 和 实现 
其 操作 的 函数 ， 在 不 担心 会 为 程序 其 余部 分 引入 错误 的 前 提 下 ,这 样 可 能 提高 操作 的 效率 。 如 
果 只 有 用 于 ADT 操 作 的 接口 函数 被 正确 地 重 写 ， 就 不 会 出 现 新 的 错误 。 





+ 示例 5.23 

假设 想 要 在 图 5-33 的 二 叉 查 找 树 中 查找 Grumpy。 将 Grumpy 与 根 节点 处 的 Hairy 相 比较 ， 
发 现 GCrumpy 在 词典 顺序 上 要 先 于 Hairy， 因 此 要 对 左 子 树 调用 ]ookup。 

左 子 树 的 根 节 点 是 Bashful， 而 将 该 标号 与 Grumpy 相 比 ， 发 现 前 者 要 先 于 后 者 。 因 此 要 
对 Bashful 的 右 子 树 递 归 地 调用 1ookup。 现 在 发 现 Grumpy 在 这 一 子 树 的 根 节 点 处 ， 并 返回 
TRUE。 这 些 步 骤 是 由 具有 图 5-34 模 式 的 词典 顺序 比较 函数 执行 的 。 




















BOOLEAN lookup(ETYPE x, TREE T) 
{ 


(1) if (T == NULL) 

(2) return FALSE; 

(3) else if (x == T->element) 

(4) return TRUE ; 

(5) else if (x < T->element) 

(6) return lookup(x, T->leftChild); 
else /* x 一 定 是 大 于 T->element */ 

(7) return lookup(x, T->rightChild); 








图 5-34 ”如 果 x 在 7 中 ， 耶 数 1ookup (x,T) 会 返回 TRUE， 否 则 返回 FALSE 
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更 具体 地 讲 , 图 5-34 中 的 递归 函数 lookup (x, 工 ) 使 用 左 子 节点 右 子 节点 数据 结构 实现 了 这 
一 算法 。 请 注意 ， lookup 返 回 的 是 BOOLEAN 类 型 的 值 ， 这 一 类 型 实际 上 与 nt 相同 , 不 过 它 定 
义 的 值 只 有 TRUE 和 FALSE， 分 别 定义 为 1 和 0。BOOLEAN 类 型 是 在 1.6 节 中 引入 的 。 此 外 ， 请 注 
意 ， 这 里 的 lookup 孙 数 只 接受 能 由 =、< 等 运算 符 比 较 的 类 型 。 如 果 要 让 它 处 理 示 例 5.23 中 用 到 
的 字符 串 那 样 的 数据 ， 就 需要 重 写 。 

在 第 (1) 行 ，]ookup 会 确定 7 是 否 为 空 。 如 果 不 为 空 , 那么 lookup 在 第 (3) 行 会 确定 x 是 否 存 
储 在 当前 节点 。 如 果 x 不 在 该 节点 ,那么 lookup 就 会 根据 x 是 小 于 还 是 大 于 当前 节点 存储 的 元 素 ， 
递归 地 查找 左 子 树 或 右 子 树 。 


5.7.3 ”二 又 查找 树 元 素 的 插入 


向 二 又 查找 树 7 中 增加 一 个 新 元 素 * 是 很 简单 的 ， 以 下 递归 算法 简要 摘 述 了 处 理 思路 。 

依据 。 如 果 7 是 空 树 ， 用 一 棵 由 单个 点 构成 的 树 蔡 代 7， 并 在 该 节点 处 放 上 x。 如 果 7 厦 空 
而 且 其 根 节 点 处 有 元 素 x， 那 么 xz 已 经 在 字典 中 ， 不 需要 再 做 任何 事情 。 

归纳 。 如 果 7 绯 空 ， 而 且 x 不 在 其 根 节 点 处 ， 那 么 如 果 x 小 于 根 节 点 处 的 元 素 ， 驶 将 x 插 和 人 左 
子 树 ， 如 果 x 大 于 根 节 点 处 的 元 素 ， 就 将 x 搬入 右 子 树 。 

如 图 5-35 所 示 的 ijnsert (x, 了) 函数 为 左 子 厄 点 右 子 广 点 数据 结构 实现 了 这 一 算法 。 在 第 (1) 





















































行 发 现 7 的 值 为 NULL 时 ， 就 会 新 建 一 个 节点 ， 该 节点 就 成 了 树 7。 第 (2) 到 第 (5) 行 会 创建 该 树 ， 
并 在 第 (10) 行 返回 。 





TREE insert (ETYPE x，TREE T) 
(1) if (T == NULL) { 
(2) T = (TREE) malloc(sizeof (struct NODE) ) ; 
(3) T->element = x; 
(4) T->leftChild = NULL; 
(5) T->rightChild = NULL; 


(6) else if (x < T->element) 

(7) T->leftChild = insert (x, T->leftChild); 
(8) else if (x > T->element) 

(9) T->rightChild = insert(x, T->rightChild); 
(10) return T; 








图 5-35 ”insert (x,T) 函数 将 x 添加 到 7 中 


如 果 在 7 的 根 节 点 处 没 找 到 x*, 那么 在 第 (6) 到 第 (9) 行 ,会 根据 相应 的 情况 对 左 子 树 或 右 子 树 
调用 insert 函 数 。 被 该 插入 操作 修改 过 的 子 树 , 会 分 别 在 第 (7) 或 第 (9) 行 成 为 7 的 根 节 点 的 左 子 
树 或 右 子 树 的 新 值 。 第 (10) 行 会 返回 增加 过 元 素 的 树 。 

请 注意 ， 如 来 x 在 7 的 根 节 点 ， 那 么 第 (1)、 第 (6) 和 第 (8) 行 的 测试 都 不 会 成 功 。 这 种 情况 下 ， 
insert 会 在 什么 都 不 做 的 情况 下 返回 Tr， 这 是 正确 的 ， 因 为 x 已 经 在 树 中 了 。 


+ 示例 5.24 

继续 示例 5.23 的 问题 ， 从 技术 上 理解 ， 对 字符 串 进行 比较 需要 的 代码 与 图 5-35 相 比 稍 有 不 
同 , 图 5-35 中 < 这 样 的 算术 比较 要 奉 代为 对 这样 恰当 定义 的 函数 的 调用 。 图 5-36 展 示 了 向 图 5-33 
插入 Filthy 后 的 二 又 查 找 树 。 首 先 对 根 节点 调用 insert ,发现 Filthy<Hairy。 因 此 ,在 图 
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5-35 的 第 (7) 行 ， 对 左 子 节 点 调用 insert。 结 果 发 现 Filthy>Bashful， 所 以 接着 在 第 (9) 行 对 
右 子 节点 调用 insert。 这 样 就 到 了 Grumpy， 它 从 词典 顺序 上 在 Filthy 之 后 ， 因 此 就 要 对 
Grumpy 的 左 子 市 点 调用 insert。 

指向 Grumpy 左 子 节点 的 指针 为 NULL， 所 以 在 第 (1) 行 必须 创建 一 个 新 节点 。 这 棵 单 节点 树 
会 返回 给 Grumpy 节 点 处 对 insert 的 调用 ， 而 且 在 第 (7) 行 该 树 会 被 安置 为 Grumpy 左 子 节 点 的 
值 , 带 有 Grumpy 和 Filthy 的 修改 过 的 树 会 返回 给 标号 为 Bashfu1 的 节点 处 对 insert 的 调用 。 
然后 ， 以 Bashful 为 根 节点 的 新 树 就 成 了 整 棵 树 根 节 点 的 左 子 树 。 最 终 的 树 如 图 $-36 所 示 。 









































Hairy 
和 
Bashful Sleepy 
\ y 
Grumpy Sleazy 
4 2 
Filthy Happy 


图 5-36 插入 Filthy 之 后 的 二 又 查找 树 


5.7.4 ”二 叉 查 找 树 元 素 的 删除 


从 二 又 查找 树 中 删除 某 个 元 素 x* 要 比 查 找 或 播 入 复杂 一 些 。 首 先 ， 要 找 出 含有 x 的 节点 ; 如 
果 没 有 这 样 的 节点 ， 就 算是 完事 了 ， 因 为 xz 不 在 这 棵 要 处 理 的 树 里 头 。 如 果 x 在 叶子 节点 处 ， 那 
么 直接 删除 该 叶子 节点 就 行 了 。 不 过 ， 如 果 x 是 某 个 内 部 节点 2， 就 不 能 直接 删除 该 节点 ， 因 为 
这 样 做 会 破坏 树 的 连通 性 。 

我 们 必须 以 某 种 方式 对 树 进 行 重新 排列 ， 从 而 在 维持 二 又 查找 树 属 性 的 同时 让 x* 从 树 中 消 
失 。 这 会 有 两 种 情况 。 第 一 种 ， 如 果 z 只 有 一 个 子 节 点 ， 就 用 该 子 节 点 代替 m， 这 样 二 又 查找 树 
的 属性 就 得 到 了 保持 。 

第 二 种 情况 ,假设 xz 的 两 个 子 节点 都 存在 。 一 种 策略 就 是 找到 标号 为 ?的 节点 闫 ， 它 是 z 右 子 
树 中 最 小 的 元 素 ， 并 在 节点 z 处 用 y 代 蔡 zx， 如 图 5-37 所 示 。 然 后 就 可 以 从 右 子 树 中 删除 节点 mm。 








n n 


Ze Za La /a 


图 5-37 要 删除 x， 先 删除 包含 右 子 树 中 最 小 元 素 y 的 方 点， 然后 将 节点 n 处 的 标号 由 x 奉 换 为 y 
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此 时 二 又 查找 树 属性 继续 成 立 。 原 因 在 于 ，xtEn 的 左 子 树 中 的 所 有 元 素 都 大 ， 而 y 大 于 x ( 因 
为 y 在 n 的 右 子 树 中 ), 所 以 y 也 比 n 左 子 树 的 所 有 元 素 都 大 。 因 此 , 就 4 的 左 子 树 而 言 , y 是 适合 于 位 
置 n 的 元 素 。 而 对 n 的 右 子 树 来 说 , ) 也 是 适合 作为 根 节 点 的 ,因为 选 出 的 > 是 右 子 树 中 的 最 小 元 素 。 

















ETYPE deletemin(TREE *pT) 
{ 
ETYPE min; 


(1) if ((*pT)->leftChild == NULL) { 
(2) min = (*pT)->element; 
(3) (tpT) = (xpT)->rightChild; 
(4) return min; 
} 
else 
(5) return deletemin(&((*pT)->leftChild)); 
} 





图 5-38 aeletemin (pT) 国 数 会 删除 并 返回 7 的 最 小 元 素 


如 图 5-38 所 示 ， 可 以 很 方便 地 定义 deletemin (pT) 函数 从 非 空 二 又 查找 树 中 删除 含 最 小 
元 素 的 节点 , 并 返回 最 小 元 素 的 值 。 我 们 给 该 孔 数 传人 的 参数 是 指 问 树 7 的 指针 的 地 址 。 该 孔 数 
中 所 有 对 7 的 引用 都 是 通过 该 指针 间接 完成 的 。 

我 们 给 函数 传人 的 参数 ,是 指向 某 个 位 置 的 指针 ,而 在 这 个 位 置 可 以 找到 指 癌 节点 ( 即 树 ) 
的 指针 ， 这 种 风格 的 树 操作 叫 作 按 引 用 调用 。 这 在 图 5-38 中 是 很 关键 的 ， 因 为 第 (3) 行 的 指针 指 
问 左 子 节点 为 NULL 的 节点 m， 我 们 希望 将 这 一 指针 蔡 代 为 男 一 个 指针 ， 节 点 m 的 rightCchild 
字段 中 的 指针 。 如 果 deletemin 的 参数 是 指 癌 市 点 的 指针 ， 那 么 这 种 改变 就 会 在 对 deletemin 
的 调用 中 发 生 ， 而 且 树 中 的 指针 其 实 不 会 改变 。 顺 便 说 一 下 ， 也 可 以 使 用 按 引用 调用 来 实现 播 
入 操作 。 在 那 种 情况 下 ， 可 以 直接 对 树 进 行 修 改 ， 而 不 必 像 图 5-35 中 所 做 的 那样 返回 修改 过 的 
树 。 这 里 将 这 一 修订 过 的 insert 函 数 留 作 本 节 习 题 。 

现在 来 看 看 图 5-38 的 工作 原理 。 沿 着 左 子 市 点 问 下 寻找 ， 直 到 在 图 5-38 的 第 (1) 行 找到 左 子 
节点 为 NULL 的 节点 ， 就 找到 了 最 小 的 元 素 。 在 该 节点 刀 处 的 元 素 / 一 定 是 该 子 树 中 最 小 的 元 素 。 
原因 在 于 , 这 里 完全 是 循 着 左 子 节点 向 下 寻找 的 , 这 样 一 来 y 要 比 m 在 该 子 树 中 的 任 一 祖先 都 小 。 
而 子 树 中 其 他 节点 要 么 是 在 m 的 右 子 树 中 ,根据 二 又 查 找 树 属性 这 些 元 素 肯 定 大 于 y， 要 么 是 在 
m 的 某 个 祖先 的 右 子 树 中 。 右 子 树 中 的 元 素 肯 定 比 m 的 某 个 祖先 处 的 元 素 大 ， 因 此 也 就 大 于 y， 
如 图 5-39 所 示 。 

在 子 树 中 找到 最 小 的 元 素 后 , 在 第 (2) 行 会 记录 下 它 的 值 , 并 在 第 (3) 行 用 它 的 右 子 树 代替 最 
小 元 素 所 在 市 点 。 请 注意 ， 在 从 子 树 中 删除 最 小 元 素 时 ， 总 是 有 着 最 简单 的 删除 情况 ， 因 为 不 
存在 左 子 树 。 

还 有 一 点 与 deletemin 相 关 的 内 容 就 是 ， 当 第 (1) 行 的 测试 失败 时 ， 就 意味 着 还 没 到 达 最 
小 元 素 ， 就 要 继续 处 理 左 子 节 点 。 这 一 步骤 是 通过 第 ($) 行 的 递归 调用 完成 的 。 

deletemin (x,pT) 困 数 如 图 $-40 所 示 。 如 果 pT 指 向 空 树 7， 就 没什么 要 做 的 ， 而 且 第 () 
行 的 测试 会 确保 什么 事 都 没 做 。 此 外 ,第 Q2) 行 和 第 (4) 行 的 测试 会 处 理 x 不 在 根 节点 的 情况 ,会 根 
据 具 体 情况 重 定 癌 到 左 子 树 或 右 子 树 。 如 果 到 达 第 (6) 行 ， 那 么 x 就 一 定 在 7 的 根 节 点 位 置 ， 而 且 
我 们 必须 替换 该 根 节 上 点。 第 (6) 行 会 测试 左 子 节点 是 否 可 能 为 NULL, 知 为 NULL,， 那么 就 可 以 在 第 
(7) 行 直接 将 7 车 换 为 其 右 子 树 。 同 样 地 ， 如 果 在 第 (8) 行 发 现 右 子 节 点 为 NULL， 那 么 就 用 7 的 左 子 
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树 来 蔡 代 7。 请 注意 ， 如 果 根 节点 的 两 个 子 节点 都 为 NULL ， 那 么 就 在 第 (7) 行 将 7 车 换 为 NULL。 
两 个 子 节点 均 不 为 NULL 的 情况 是 在 第 (10) 行 处 理 的 。 在 这 里 会 调用 aeletemin, 返回 右 子 
树 的 最 小 元 素 y， 并 从 该 子 树 中 删除 y。 第 (10) 行 的 赋值 操作 会 在 7 的 根 节点 处 用 y 代 替 x。 


有 
人 作 


LN 
pa 


图 5-39 ” 右 子 树 中 所 有 其 他 元 素 都 大 于 y 





void delete(ETYPE x, TREE *pT) 
{ 
(1) if ((*pT) != NULL) 
(2) if (x < (*pT)->element) 
(3) delete(x, &((*pT)->leftChild)); 
(4) else if (x > (*pT)->element) 
(5) delete(x, &((*pT)->rightChild)); 
else /* 这 里 ， 文 在 (*pz) 的 根 节 点 处 */ 
(6) if ((*pT)->leftChild == NULL) 
(7) (*#pT) = (*pT)->rightChild; 
(8) else if ((*pT)->rightChild == NULL) 
(9) (xpT) = (*pT)->leftChild; 
else /* 这 里 的 两 个 子 节点 都 不 为 NULL */ 
(10) (*pT) ->element = 
deletemin(&((*pT)->rightChild)); 








图 5-40 ”gdelete (x,pT) 国 数 从 7 中 删除 元 素 x 


+ 示例 5.25 
如 果 使 用 类 似 aelete (但 能 够 比较 字符 串 ) 的 函数 从 图 5-36 中 的 二 又 查 找 树 删 除 Hairy， 
结果 如 图 5-41 所 示 。 因 为 Hairy 在 具有 两 个 子 节 点 的 节点 中 ， 所 以 delete 会 调用 deletemin 
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水 数 ， 从 根 广 点 的 右 子 树 中 删除 并 返回 最 小 的 元 素 Happy， 然 后 Happy 就 成 了 曾 存 放 Hairy 的 
该 树 根 节点 的 标号 。 











Happy 
> J 
Bashful Sleepy 
> 
Grumpy Sleazy 
Filthy 


图 5-41 删除 Hairy 后 的 二 叉 查 找 树 





5.7.5 ”习题 


(1) 假设 使 用 最 左 子 节点 右 兄 弟 节 点 表示 法 实现 二 又 查找 树 。 重 新 编写 适用 于 这 一 数据 结构 的 实现 了 
插入 、 删 除 和 查找 这 些 词典 操作 的 函数 。 

(2) 如 果 按 顺序 插入 单词 : Doc、Dopey、Inky、Blinky、Pinky 和 sue, 会 使 图 5-33 中 的 二 叉 查 找 
树 变 成 什么 样 ? 然后 ， 依 次 删除 Doc、Sleazy 和 Hairy 后 又 会 怎样 ? 

(3) 用 对 字符 串 的 词 由 比较 代替 对 整数 的 算术 比较 ， 重 新 编写 Lookup 、insert 和 delete 国 数 。 

(4)* 重新 编写 insert 函 数 ， 使 得 树 参数 可 以 按 引 用 传递 。 

(5) * 在 本 节 中 ， 我 们 曾 以 “ 按 引 用 调用 ”的 方式 编写 过 qelete 图 数 。 不 过 ， 也 可 以 用 编写 insert 
函数 的 风格 编写 该 郴 数 ， 即 接受 树 作为 参数 ， 而 不 是 接受 指向 树 的 指针 作为 参数 。 编 写 这 一 版 本 
的 aelete 操 作 。 注意: 让 deletemin 返 回 修改 过 的 树 并 非 真正 可 能 ， 因 为 它 还 必须 返回 最 小 的 元 
素 。 我 们 可 以 重新 编写 aeletemin， 使 其 返回 同时 具有 新 树 和 最 小 元 素 的 结构 体 。 

(6) 要 删除 融 有 两 个 子 节 点 的 节点 ， 除 了 通过 在 右 子 树 中 找到 最 小 元 素 ， 还 可 以 在 左 子 树 中 找到 最 大 
的 元 素 ， 并 用 它 替 代 删 除 的 元 素 。 重 新 编写 来 自 图 5-38 和 图 5-40 的 daelete 和 aqeletemin 函 数 ， 
从 而 融入 这 种 修改 。 

(7)* 在 需要 删除 某 个 具有 父 节 点 P、( 非 空 的 ) 左 子 节 点 / 利 ( 非 空 的 ) 右 子 节点 7 的 节点 1 处 的 元 素 时 ， 
另 一 种 处 理 删 除 操作 的 方式 是 ， 找 出 ?的 右 子 树 中 存放 最 小 元 素 的 节点 下 。 接 着 ， 让 r 代 替 m 成 为 P 
的 左 子 节 点 或 右 子 节点 ， 并 让 1 成 为 m 的 左 子 节点 。 请 注意 ，m 之 前 不 能 有 左 子 节 点 。 证 明 这 一 系 
列 改变 为 何 会 保留 二 叉 查 找 树 属性 。 大 家 是 否 愿意 选择 这 一 策略 蔡 代 5.7 节 中 描述 过 的 那 种 ?” 提 
示 : 对 这 两 种 方式 而 言 ， 考 虑 它们 对 路 径 长 度 的 影响 。 正 如 我 们 将 在 5.8 节 中 看 到 的 ， 短 路 径 会 让 
操作 运行 得 更 迅速 。 

(8)* 在 本 习题 中 ， 考 虑 图 5-39 所 示 的 二 又 查找 树 。 通 过 对 i 的 归纳 证 明 ， 如 果 1 三 i 三， 那么 y<z,。 
然后 ， 证 明 y 是 以 z 为 根 节点 的 树 中 最 小 的 元 素 。 

(9) 编写 完整 的 C 语 言 程序 ， 实 现存 储 整数 的 词典 。 接 受 形 为 x i 的 命令 ， 其 中 x 是 字母 i (插入 )、a 
(删除 ) 和 1 (查找 ) 中 的 一 个 。 整 数 i 是 该 命令 的 参数 ， 就 是 有 待 插入、 删除 或 查找 的 整数 。 
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5.8” 二 又 查找 树 操 作 的 效率 


二 叉 查找 树 提供 了 一 种 相当 快速 的 词典 实现 。 首 先 请 注意 ， 插 入 、 删 除 和 查找 操作 各 会 进 
行 奉 干 次 递归 调用 ， 调 用 次 数 等 于 所 经 过 的 路 径 的 长 度 。 但 该 路 径 必 须 包 含 达 到 右 子 树 最 小 元 
素 的 路 线 , 以 防 deletemin 被 调用 。 对 lookup、insert、delete 和 deletemin 斥 数 进 行 简 
单 的 分 析 ， 可 知 各 操作 都 花费 O0) 的 时 间 ， 而 且 要 加 上 一 次 递归 调用 的 时 间 。 此 外 ， 因 为 该 递 
归 调 用 总 是 在 当前 市 点 的 子 市 点 处 进行 的 ， 所 以 每 次 成 功 调用 中 市 点 的 高 度 至 少 要 减少 1。 

因此 ， 如 果 以 指 问 某 个 高 度 为 h 的 节点 的 指针 调用 这 些 函 数 所 花 的 时 间 为 T(h) ， 就 有 以 下 
递 推 关 系 来 为 7(h) 确定 上 界 。 

依据 。7(0) = 0() 。 也 就 是 说 ， 在 对 叶子 节点 调用 函数 时 ， 该 调用 要 么 终止 ， 不 再 有 进 一 
步 的 调用 ,要 么 以 NULL 参 数 进行 一 次 递归 调用 ,接着 会 返回 而 不 再 继续 调用 。 这 些 工 作 所 花 时 
间 为 00)。 

归纳 。 对 有 三 1，7T(h) 三 7T(4-1)+00)。 也 就 是 说 ， 对 任何 内 部 三 点 调用 函数 所 花 的 时 间 ， 
都 等 于 OQ) 加 上 对 高 度 至 多 为 h-1 的 节点 进行 一 次 递归 调用 所 花 的 时 间 。 如 果 作 出 7T(h) 会 随 着 
h 的 增加 而 增加 这 一 合理 假设 ， 那 么 该 递归 调用 的 时 间 不 会 大 于 7T(h 一 1)。 

该 递 推 关系 的 解 是 O(h) ， 正 如 3.9 节 中 讨论 过 的 那样 。 因 此 ， 对 具有 7 个 节点 的 二 义 查 找 树 
执行 词典 操作 的 运行 时 间 至 多 与 该 树 的 高 度 成 比例 。 不 过 具有 7 个 节点 的 二 又 查找 树 通 党 高 度 为 
多 少 呢 ? 


5.8.1 最 坏 情 况 


在 最 坏 的 情况 下 ， 二 又 树 的 所 有 方 点 部 排列 在 一 条 路 径 上 ， 就 像 图 5-42 所 示 的 树 那 样 。 例 
如 ， 取 一 列 有 序 的 [个 元 素 ,， 将 这 些 元 素 一 个 个 地 依次 插入 一 棵 空 树 ， 就 可 以 形成 这 样 的 树 。 也 
有 不 全 由 右 子 节 点 组 成 ， 而 是 由 左右 子 节 点 混合 组 成 的 单 路 径 树 ， 其 路 径 上 的 内 部 节点 既 可 能 
是 左 子 节点 也 可 能 是 右 子 节 氮 。 














、 


图 5-42 ”退化 的 二 叉 树 


像 图 5-42 这 样 具 有 Kk 个 节点 的 树 的 高 度 显然 为 k-1。 因 此 可 以 预见 ， 如 果 具 有 Kk 个 元 素 的 词 
典 的 表示 不 幸 是 这 些 树 中 的 一 种 ,那么 查找 、 插 入 和 删除 操作 所 花 时 间 都 会 是 O(k) 。 从 直觉 上 
讲 ， 如 果 需 要 查找 某 个 元 素 *， 平 均 需 要 走 过 一 半路 径 才 会 找到 它 ， 需 要 查看 妨 2 个 节点 。 如 果 
这 还 没有 找到 x， 就 需要 继续 向 下 搜索 该 树 ， 直 到 到 达 x 所 在 的 位 置 为 止 ， 平均 也 要 走 过 该 路 线 
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的 一 半 。 因 为 查找 、 插 入 和 删除 操作 都 涉及 元 素 的 查找 ， 所 以 可 知 ， 在 给 定 图 5-42 所 示 树 的 最 
坏 情况 下 ， 这 些 操作 平均 要 花 的 时 间 都 是 O(K) 。 
5.8.2 最 佳 情 况 


不 过 ,二叉树 不 一 定 非 得 像 图 5-42 这 样 又 高 又 瘦 ， 它 也 可 以 是 图 5-43 这 种 分 枝 从 生 的 低 矮 
样式 。 而 后 者 这 样 的 树 ， 每 个 内 部 节点 向 下 到 某 层 的 两 个 子 节 点 都 存在 ， 而 且 下 一 层 的 所 有 叶 
子 节点 也 都 存在 ， 这 样 的 结构 叫 作 完全 树 或 完整 树 。 





图 5-43 ”有 7 个 节点 的 完全 二 又 树 


高 度 为 的 完全 二 叉 树 共有 2” 一 1 个 节点 。 我 们 可 以 通过 对 高 度 h 的 归纳 证 明 这 一 声明 。 

依据 。 如 果 h = 0， 那 么 该 树 由 一 个 节点 组 成 。 因 为 2 -1=1 ， 所 以 依据 情况 成 立 。 

归纳 。 假 设 高 度 为 的 完全 二 义 树 有 7” 一 1 个 节点 ， 并 考虑 高 度 为 h+1 的 完全 二 义 树 。 该 
树 有 一 个 根 节点 ,并 由 两 棵 高 度 为 h 的 完全 二 又 树 分 别 作为 其 左右 子 树 。 例 如 ， 图 5-43 中 高 度 为 
2 的 完全 二 又 树 包 含 根 节点 m1， 由 ns、nna 和 ns3 个 节点 构成 的 左 子 树 ( 高度 为 1 的 完全 二 叉 树 )， 以 
及 由 其 余 3 个 节点 构成 的 右 子 树 ( 另 一 棵 高 度 为 1 的 完全 二 叉 树 )。 根 据 归纳 假设 ， 两 棵 高 度 为 有 
的 完全 二 叉 树 共有 2(C2” -D 个 节点 。 在 加 上 根 节点 后 ， 可 知 高 度 为 h+1 的 完全 二 叉 树 共有 
2(2” -D+1=2 一 一 1 个 节点 ， 这 就 证 明了 归纳 步骤 。 

现在 可 以 将 这 一 关系 反 转 , 说 一 棵 具有 k=2”-1 个 节点 的 完全 二 又 树 高 度 为 h, 这 样 一 来 ， 
K+1= 2 。 两 边 取 对 数 ， 就 有 log,(k+1) =h+1， 或 者 大 致 可 以 说 h 是 O(logk) 。 因 为 查找 、 插 
入 和 删除 的 运行 时 间 都 与 树 的 高 度 成 比例 ， 所 以 这 些 操 作 所 花 的 时 间 是 节点 数 的 对 数 。 这 样 的 
性 能 要 比 图 5-42 所 示 最 糟 情况 所 花 的 线性 时 间 强 多 了 。 随 着 词典 的 大 小 越 来 越 大 ， 词 典 操作 运 
行 时 间 的 增长 要 比 集合 中 元 素 的 增长 慢 得 多 。 


5.8.3 一 般 情 况 


图 5-42 所 示 情 况 和 图 5-43 所 示 情 况 哪 个 更 普遍 ?其 实 , 两 者 在 实践 中 都 不 常见 , 不 过 图 5-43 
中 的 完全 树 提 供 的 词典 操作 效率 与 一 般 情况 的 效率 是 近似 的 。 也 就 是 说 ,平均 情况 下 ， 查 找 、 
插入 和 删除 花费 的 都 是 对 数 时 间 。 

要 证 明 一 般 二 叉 树 可 以 提供 对 数 时 间 的 词典 操作 是 很 难 的 。 证 明 的 要 点 在 于 ， 从 这 样 的 树 
的 根 节 点 到 某 个 随机 市 点 的 路 径 长 度 的 期 望 值 是 O(logn) 。 本 方 习题 中 将 给 出 这 一 期 望 值 的 递 
推 等 式 。 

不 过 ， 我 们 可 以 直观 地 看 出 这 为 什么 应 该 是 正确 的 运行 时 间 ， 理 由 如 下 。 二 又 树 的 根 节 点 
会 将 除 它 自己 之 外 的 节点 分 为 两 棵 子 树 。 在 最 平均 的 分 布 中 , 一 棵 有 k 个 节点 的 树 将 会 有 两 棵 各 
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有 约 大 /2 个 节点 的 子 树 。 如 果 根 节点 元 素 刚好 是 在 一 列 有 序 元 素 的 正中 位 置 ， 就 会 形成 这 种 情 
况 。 而 在 最 坏 的 分 布 中 ， 根 节点 元 素 是 词典 中 的 第 一 个 或 最 后 一 个 元 素 ， 这 样 就 会 使 一 棵 子 树 
为 空 ， 而 男 一 棵 子 树 中 有 一 1 个 元 素 。 

平均 而 言 ， 可 以 预期 根 节 点 是 在 已 排序 表 正 中 和 极端 之 间 ， 而 且 可 以 预期 约 有 /4 个 节点 
在 较 小 的 子 树 中 , 另外 的 3k/4 个 节点 在 较 大 子 树 中 。 假设 在 向 下 探索 树 的 过 程 中 , 每 次 递归 调 
用 时 始终 移动 到 较 大 子 树 的 根 节点 ， 而 且 类 似 的 假设 适用 于 每 层 元 素 的 分 布 。 在 第 一 层 ， 较 大 
子 树 会 按照 1:3 的 比例 划分 ,在 第 二 层 留 下 共有 (3/4)(3k/4)， 即 9k/16 个 节点 的 最 大 子 树 。 
此 ， 可 以 预见 在 第 d 层 的 最 大 子 树 约 有 (3/4)"k 个 节点 。 

如 果 d 变 得 足够 大 ， 那 么 (3/4)"k 的 量 会 接近 1。 而 且 可 以 预见 ， 在 这 一 层 ， 最 大 子 树 将 是 











由 一 个 叶子 节点 组 成 的 。 因 此 要 问 ，4 为 什么 值 可 以 使 (3/4)*k 夺 1? 如 果 取 以 2 为 底 的 对 数 ， 就 
得 到 
d log,(3/4)+log, klog,!1 (5.1) 


现 有 log,1=0 ， 且 log,(3/ 作 是 一 个 负 常 数 ， 约 为 -0.4。 因 此 可 将 (5.1) 式 重新 写 为 
log2k 三 0.4d4 , 或 4 二 (log, 有 /0.4=2.5log,k。 

换 名 话说， 在 深度 约 为 节点 数 以 2 为 底 的 对 数 的 2.5 倍 的 位 置 (或 是 在 更 高 的 层 数 )， 就 有 望 
全 是 叶子 节点 了 。 这 一 论述 证 实 了 ( 但 并 未 证 明 ) 一 般 二 又 查找 树 的 高 度 与 该 树 节点 数 的 对 数 
成 正 比 这 一 陈述 。 

5.8.4 习题 
(D 如 果树 7 高 度 为 x， 而 且 分 支 系 数 为 5， 那 么 树 7 最 多 可 以 有 多 少 个 节点 ， 最 少 有 多 少 个 节点 ? 
(2) ** 进行 如 下 实验 ， 从 n 个 不 同 值 的 n! 种 顺序 中 任 选 一 种 ， 并 按照 这 一 顺序 将 这 些 值 插 入 一 棵 空 的 


二 叉 查 找 树 中 。 设 Pln) 是 实验 后 这 n 个 值 中 某 个 特定 值 v 所 在 市 点 的 深度 的 期 望 值 。 
(a) 证 明 ,， 对 n 三 2， 











n—l 
P(n)=1+ FP) 
HN 1 


(b) 证 明 Pl(n) 是 O(logn)。 


5.9 ”优先 级 队列 和 偏 序 树 


到 目前 为 止 , 我 们 只 看 到 一 种 抽象 数据 类 型 一 一 词典 , 以 及 它 的 一 种 实现 一 一 二 又 查找 树 。 
本 市 将 研究 男 一 种 抽象 数据 类 型 以 及 它 最 有 效率 的 一 种 实现 。 这 种 叫 作 优先 级 队列 的 抽象 数据 
类 型 是 各 自 有 优先 级 与 之 关联 的 一 组 元 素 。 例 如 ， 这 些 元 素 可 以 是 一 些 记 录 ， 而 优先 级 则 可 能 
是 记录 中 某 个 字段 的 值 。 与 优先 级 队列 ADT 有 关 的 两 种 操作 如 下 : 

(1) 向 集合 中 插入 一 个 元 素 ( insert ); 

(2) 从 集合 中 找 出 优先 级 最 高 的 元 素 并 将 其 删除 ( 这 种 组 合 操作 称 为 dGeletemax )， 被 删除 
的 元 素 由 该 函数 返回 。 


+ 示例 5.26 
分 时 操作 系统 从 多 个 来 源 接受 服务 请 求 ， 而 这 些 作业 的 优先 级 可 能 不 尽 相 同 。 例 如 ， 优 先 
级 最 高 的 可 能 是 系统 进程 ， 这 些 进程 中 可 能 包含 监控 传人 数据 ( 比如 在 终端 的 按键 动作 生成 的 
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言 号 ,或 是 局 域 网 上 数据 包 的 到 达 所 生成 的 信号 ) 的 “守护 进程 ”。 接 着 可 能 是 用 户 进 程 , 那些 
普通 用 户 发 出 的 指令 。 再 下 来 就 可 能 是 某 些 特定 的 后 台 作 业 ， 比 如 加 磁带 备份 数据 ， 或 是 用 
户 已 指定 以 低 优先 级 运行 的 长 计算 。 
作业 可 以 表示 为 记录 ， 这 种 记录 由 对 应 作业 的 整数 ID 和 对 应 作业 优先 级 的 整数 组 成 。 也 就 
是 将， 可 以 使 用 如 下 结构 体 
struct ETYPE { 
int jobID; 


int priority; 


}; 

表示 优先 级 队列 中 的 元 素 。 在 初始 化 新 的 作业 时 ， 它 会 得 到 一 个 ID 和 一 个 优先 级 。 然 后 对 
等 竺 服务 的 作业 构成 的 优先 级 队列 执行 这 一 元 素 的 插入 操作 。 当 处 理 吉 资源 可 用 时 ， 系 统 就 会 
来 到 优先 级 队列 ， 并 执行 aeletemax 操 作 。 由 该 操作 返回 的 元 素 就 是 等 待 服务 的 作业 中 优先 级 
最 高 的 作业 ， 而 该 作业 正 是 接 下 来 要 执行 的 。 


+ 示例 5.27 

我 们 可 以 使 用 优先 级 队列 ADT 实 现 排 序 算法 。 假设 有 一 列 整 数 a1/、a;、…、a, 要 排序 ， 可 以 
将 这 些 整 数 放 入 一 个 优先 级 队列 ， 分 别 使 用 这 些 元 素 的 值 作为 各 自 的 优先 级 。 如 果 随 后 执行 
deletemax 操 作 n 次 ， 这 些 整 数 就 会 按照 从 大 到 小 的 顺序 依次 被 选 出 来 。5.10 节 还 会 更 详细 地 讨 
论 这 种 称 为 堆 排 序 的 算法 。 


5.9.1 偏 序 树 


实现 优先 级 队列 的 一 种 有 效 方式 是 使 用 偏 序 村 ( Partially Ordered Tree，POT )， 这 是 一 种 具 
有 如 下 属性 的 带 标 号 二 又 树 。 

() 节点 的 标号 是 具有 “优先 级 ”的 元 素 ， 该 优先 级 可 以 是 元 素 的 值 , 也 可 以 是 元 素 某 个 组 
成 部 分 的 值 。 

(2) 存储 在 节点 中 的 元 素 的 优先 级 ， 不 小 于 存储 在 其 子 节点 中 的 元 素 的 优先 级 。 

属性 (2) 说 明 , 任何 子 树 根 节点 处 的 元 素 总 是 该 子 树 中 最 大 的 元 素 。 我 们 将 属性 (2) 称 为 偏 序 
树 属性 ， 或 POT 属 性 。 


+ 示例 5.28 

图 $-44 展 示 了 一 棵 具有 10 个 元 素 的 偏 序 树 。 在 这 里 以 及 本 节 的 其 他 部 分 中 ， 我 们 都 将 用 元 
素 的 优先 级 来 表示 它们 ， 就 像 元 素 和 它们 的 优先 级 是 一 回 事 那样 。 请 注意 ， 相 等 的 元 素 可 能 
现在 树 中 的 不 同 层 级 。 要 说 明 偶 序 树 属 性 在 根 节 点 得 到 满足 ， 请 注意 ， 根 节点 处 的 元 素 18 不 小 
于 其 子 节 点 处 的 元 素 18 和 16。 同 样 ， 可 以 验证 在 该 树 的 每 个 内 部 节点 处 偶 序 树 属 性 都 成 立 。 因 
此 ， 图 5-44 是 一 棵 偏 序 树 。 

偏 序 树 为 优先 级 队列 提供 了 一 种 实用 的 抽象 实现 。 简 单 地 说 ， 要 执行 deletemax 操 作 ， 就 
要 找到 根 节 点 ， 它 肯定 是 最 大 的 ， 并 用 底层 的 最 右 节 点 代替 它 。 不 过 ， 这 样 做 时 ， 偶 序 树 属 性 
可 能 被 破坏 ， 因 此 必须 还 原 偶 序 树 属 性 ， 要 让 新 放置 在 根 节 点 处 的 元 素 “ 向 下 这 ”， 直 到 它 到 达 
合适 的 层次 ,使 得 它 小 于 它 的 父 厄 点 ， 并 且 不 小 于 它 的 子 节 点 。 要 执行 插入 操作 ， 就 要 在 底层 
尽 可 能 左 的 位 置 增加 一 个 新 的 叶子 市 点 ， 如 果 底 层 没有 空位 置 ， 就 要 新 添加 一 个 层级 ， 并 将 该 
市 点 放 在 新 一 层 的 左 端 。 这 样 也 可 能 对 偏 序 树 属性 造成 破坏 , 如 果 造 成 破坏 , 就 要 让 新 元 素 “ 癌 
上 冒 "， 直 到 它 找 到 合适 的 位 置 。 
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图 5-44 ”有 10 个 节点 的 偏 序 树 


5.9.2 平衡 含 序 树 和 堆 


如 果 偏 序 树 除 最 下 层 之 外 的 所 有 层级 的 节点 全 存在 ， 而 且 最 下 层 的 叶子 节点 尽 可 能 集中 在 
左 侧 , 那么 这 样 的 偏 序 树 就 是 平衡 的 。 这 一 条 件 说 明 ， 如 果 该 树 有 n 个 节点 , 那么 从 根 市 点 到 任 
何 节 点 的 路 径 都 不 可 能 比 log, n 长 。 图 5-44 中 的 树 就 是 平衡 偏 序 树 。 

平衡 偏 序 树 可 以 用 称 为 堆 的 数组 数据 结构 实现 ， 这 种 数据 结构 提供 了 一 种 迅速 、 紧 凑 的 优 
先 级 队列 ADT 实 现 。 堆 就 是 对 元 素 下 标 有 着 特殊 解释 的 数组 4。 首 先 从 4[1] 中 的 根 节 点 开始 , 并 
未 使 用 4[0]。 在 根 节点 之 后 ， 各 层级 依次 出 现 。 在 同一 层级 中 ,市 点 按照 从 左 到 右 的 顺序 排列 。 

因此 ， 根 节点 的 左 子 节点 是 在 4[2] 中 ， 而 根 节点 的 右 子 市 点 在 4[3] 中 。 一 般 而 言 ，4 四 处 市 
点 的 左 子 节 点 在 4[21] 中 ， 而 其 右 子 节点 在 4[2i+1] 中 ， 如 果 这 些 子 节 点 在 偏 序 树 中 都 存在 的 话 。 
这 种 树 的 平衡 性 质 使 这 种 表示 成 为 可 能 。 这 些 元 泰 的 偏 序 树 属性 说 明 ， 如 果 4[ 订 有 两 个 子 节点 ， 
那么 4[ 相 不 小 于 4[2 习 和 4[25 +1， 如 果 4[ 加 只 有 一 个 子 节点 ， 那 么 4[ 可 不 小 于 4[2 引 。 


1 2 3 4 3 6 7 8 9 10 
6 11971913|137|s 


图 $-45 ”图 5-44 对 应 的 堆 


























实现 的 层次 


对 词典 和 优先 级 队列 这 两 种 ADT 进 行 比较 ， 并 注意 到 每 种 情况 下 只 给 出 了 一 种 抽象 实现 以 
及 对 应 该 抽象 实现 的 一 种 数据 结构 ， 这 样 做 是 很 有 意义 的 。 每 种 ADT 都 有 其 他 的 抽象 实现 ， 而 
每 种 抽象 实现 也 都 有 其 他 的 数据 结构 。 之 前 已 经 说 过 ， 在 本 书 随后 的 内 容 中 还 将 讨论 词典 的 其 
他 抽象 实现 ， 比 如 散 列表 ， 而 且 在 $.9 节 的 习题 中 表示 过 ， 二 又 查找 树 对 优先 级 队列 而 言 也 是 种 
合适 的 抽象 实现 。 下 表 总 结 了 目前 为 止 我 们 对 词典 和 优先 级 队列 的 抽象 实现 及 数据 结构 的 了 解 。 


ADT 抽象 实现 数据 结构 
词典 二 又 查找 树 左 子 节 点 右 子 节 点 结构 
优先 级 队列 平衡 俩 序 树 堆 
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+ 示例 5.29 

表示 图 5-44 所 示 平 衡 偏 序 树 的 堆 如 图 5-45 所 示 。 例 如 ，4[4] 存 放 着 值 9， 这 一 数组 元 素 表示 
图 $-44 中 根 节 点 的 左 子 节点 的 左 子 节点 。 而 该 节点 的 子 节点 则 在 4[8] 和 4[9] 中 。 它 们 的 元 素 分 别 
是 3 和 7， 都 不 大 于 9， 正 如 偏 序 树 属性 所 要 求 的 。 数 组 元 素 4[5] 对 应 着 根 节 点 左 子 节 点 的 右 子 节 
点 ， 它 的 左 子 节 点 在 4[10] 的 位 置 。 它 可 以 有 存放 在 4[11] 中 的 右 子 节点 , 但 图 5-44 中 的 偏 序 树 只 
有 10 个 元 素 ， 所 以 4[11] 并 不 是 该 堆 的 一 部 分 。 

尽管 这 里 展示 的 树 节 点 和 数组 元 素 似 乎 就 只 是 优先 级 本 身 ， 但 原则 上 讲 树 节 点 或 数组 中 出 
现 的 是 完整 的 记录 。 正 如 我 们 将 要 看 到 的 ， 在 偏 序 树 或 其 堆 表 示 的 父子 节点 间 要 进行 很 多 元 素 
交换 。 因 此 ， 如 果 数 组 元 素 是 指向 表示 优先 级 队列 中 各 对 象 的 记录 的 指针 ， 并 将 这 些 记录 存储 
在 堆 “ 之 外 ”的 另 一 个 数组 中 ， 就 会 更 有 效率 。 这 样 就 可 以 在 不 调整 记录 本 身 的 情况 下 直接 对 
指针 进行 交换 。 


5.9.3 ”优先 级 队列 操作 在 堆 上 的 执行 


在 5.9 节 和 5.10 节 中 , 会 用 全 局 整数 数组 A[1. .MAX] 表 示 堆 。 这 里 假设 元 素 都 是 整数 ， 而 且 
都 等 于 它们 的 优先 级 。 当 元 素 是 记录 时 ， 可 将 指向 记录 的 指针 存储 在 数组 中 ， 并 根据 记录 中 的 
基 个 字段 来 确定 元 素 的 优先 级 。 

假设 有 一 个 满足 偏 序 树 属性 的 具有 -1 个 元 素 的 堆 , 我 们 要 向 4[n] 中 添加 第 n 个 元 素 。 偏 序 
树 属性 在 各 处 都 继续 成 立 , 除了 在 4[n] 和 它 的 父 节点 间 可 能 有 例外 。 因 此 ,如果 4[n] 大 于 其 父 节 
点 位 置 的 元 素 4[n/2]， 就 必须 交换 这 些 元 素 。 而 4[n/2] 与 其 父 节 点 间 也 可 能 违背 偏 序 树 属 性 。 如 
果 这 样 的话 ， 就 要 让 新 元 素 递 归 地 “ 冒 泡 ”， 直 到 它 到 达 父 节点 有 一 个 更 大 元 素 的 位 置 , 或 是 到 
达 根 节点 位 置 。 

执行 这 一 操作 的 C 语 言 函数 bubbleUp 如 图 5-46 所 示 。 它 使 用 swap (A, i,j) 函数 交换 4 
和 4 四处 的 元 素 , 该 函数 也 是 在 图 5-46 中 定义 的 。bubbleUp 的 操作 很 简单 。 给 定 表 示 节 点 的 参 
数 1， 它 表示 的 节点 与 其 父 节 点 有 可 能 违背 偏 序 树 属性 ,测试 是 否 有 ;= 1 ， 也 就 是 测试 是 否 为 根 
节点 , 在 根 节点 的 话 就 不 会 破坏 偏 序 树 属 性 。 如果 不是 , 则 测试 4[ 相 是否 大 于 其 父 节点 处 的 元 素 ; 
如 果 是 ， 就 在 其 父 节 点 处 递归 地 调用 bubpbleUp， 交 换 4[ 中 与 其 父 节 点 。 












































void swap(int A[], int i, int j) 


{ 
int temp; 
temp = A[i]; 
A[i] = AL[Lj]; 
A[j] = temp; 
} 


void bubbleUp(int A[], int i) 


if (i > 1 && A[i] > A[i/2]) { 
swap(A, i, i/2); 
bubbleUp (A, i/2); 
} 
} 


图 5-46 。” swap 函数 交换 数组 元 素 ， 而 bubbleUp 函 数 则 将 堆 中 的 新 元 素 推 到 它 的 右 侧 位 置 
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+ 示例 5.30 
假设 有 图 5-45 所 示 的 堆 , 并 向 其 添加 了 优先 级 为 13 的 第 11 个 元 素 。 该 元 素 会 出 现在 4[11] 中 ， 
就 有 了 如 下 数组 
1 2 3 4 5 6 7 8 9 10 11 
elsTeTol7r TT ols TT 
调用 pubbleUp (A,11) ， 对 4[11] 和 4[5] 进 行 比较 ， 因 为 4[11] 更 大 ， 所 以 必须 交换 这 两 个 
元 素 。 也 就 是 说 4[5] 和 4[11] 违 背 了 偏 序 树 属性 。 因 此 ， 数 组 就 成 了 
1 2 3 4 5 6 7 8 9 10 11 
lsTeT TsTrTo Ts Tr TT 
调用 bubbleUp (A,5), 对 4[2] 和 4[5] 进 行 比 较 , 因为 4[2] 更 大 , 所 以 不 会 违背 偏 序 树 属性 ， 
bubbleUp (A, 5) 不 会 进行 任何 操作 。 这 样 就 已 经 恢复 了 该 数组 的 偏 序 树 属性 。 
现在 介绍 如 何 实现 优先 级 队列 的 插入 操作 。 设 n 是 优先 级 队列 中 当前 的 元 素数 , 并 假设 数组 
A[1..n] 已 经 满足 偏 序 树 属性 。 增 加 nx， 并 将 待 插入 的 元 素 存 储 到 新 的 AIn] 中 。 最 后 ， 调 用 
bubbleUp (A,n)。 表 示 插 入 操作 的 代码 如 图 5-47 所 示 。 参 数 x 是 待 插 入 的 元 素 ， 而 参数 pn 是 指 
向 优先 级 队列 当前 大 小 的 指针 。 请 注意 ，n 必 须 按 引 用 传递 ,也 就 是 说 ,通过 指向 n 的 指针 传递 ， 
这 样 当 n 增 加 时 ， 改 变 才 不 只 是 在 插入 操作 局 部 造成 影响 。 这 里 省 略 了 对 n 二 MAX 的 检查 。 














void insert(int A[], int x, int *pn) 
{ 

(*pn)++; 

Alxpn] = x; 

bubbleUp (A, *pn); 
} 


图 5-47 在 堆 上 实现 的 优先 级 队列 插入 操作 


要 实现 优先 级 队列 的 deletemax 操 作 ， 需要 对 堆 或 偏 序 树 进行 男 一 项 操作 ， 这 次 是 让 根 节 
点 处 可 能 违背 偏 序 树 属性 的 元 素 疝 下 沉 。 假设 4 丰 可 能 违背 偏 序 树 属性 , 在 它 中 的 元 素 可 能 小 于 
其 子 节点 4[2 订 和 4[2i+1] 中 的 一 个 或 两 个 。 我 们 可 以 将 其 与 其 中 一 个 子 节点 交换 ， 不 过 一 定 要 注 
意 是 与 哪 一 个 交换 。 如 果 与 两 个 子 节点 中 较 大 的 那个 交换 , 那么 肯定 不 会 在 4[ 四 曾经 的 两 个 子 节 
点 间 引 入 偏 序 树 属性 的 破坏 ， 因 为 较 大 的 那个 现在 已 经 是 较 小 那个 的 父 节 点 了 。 

图 5-48 中 的 bubbleDown 函 数 实 现 了 这 一 操作 。 在 选择 了 与 4[ 引 进行 交换 的 子 节点 后 , 它 会 
递归 地 调用 自身 ， 以 消除 新 位 置 上 的 元 素 4[i] (也 就 是 现在 的 A[2i] 或 A[2i+1] ) 与 其 新 子 节 
点 之 间 可 能 存在 的 偏 序 树 属 性 的 破坏 。 参 数 n 是 堆 中 的 元 素数 ， 或 者 说 是 最 后 一 个 元 素 的 下 标 。 

这 个 函数 有 点 琅 手 。 如 果 4[ 订 有 两 个 子 节点 ,就 必须 决定 将 其 与 哪个 子 市 点 交换 ,所 以 首先 
要 在 图 5-48 的 第 (1) 行 假设 较 大 的 子 节 点 是 4[21]。 而 如 果 右 子 节 点 存在 ( 即 chil4<n ), 并 且 右 子 
节点 更 大 ， 第 CO) 行 的 测试 就 会 得 到 满足 ， 并 在 第 (3) 行 让 cjpzrd 成 为 4 四 的 右 子 节点 。 

在 第 (4) 行 有 两 项 需要 测试 的 内 容 。 首 先 ，4 加 在 该 堆 中 有 可 能 真 的 没有 子 节 点 。 因 此 要 通 
过 检测 是 否 有 chil4 三 n 来 确定 4 中 是 否 为 内 部 节点 。 第 第 二 项 测试 是 检测 4 目 是 否 小 于 4[child]。 
如 果 两 项 条 件 都 满足 ， 那 么 在 第 (5) 行 就 要 将 4[ 站 与 它 较 大 的 那个 子 节 点 交换 ， 并 在 第 (6) 行 递归 
地 调用 pubpbleDown， 如 果 有 必要 的 话 ， 就 将 违背 偏 序 树 属 性 的 元 素 进 一 步 加 下 压 。 
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void bubbleDown(int A[], int i, int n) 
{ 
int child; 


child = 2*i; 

if (child < n && A[child+1] > A[child]) 
++child; 

if (child <= n && A[i] < A[child]) 荆 
swap(A, i, child); 
bubbleDown(A, child, n); 


A 


OO 
Me et Wet Wat tt et 


} 
} 








图 5-48 pubbleDown 会 将 违背 偏 序 树 属性 的 元 素 压 到 合适 的 位 置 


可 以 按照 图 $-49 所 示 的 方式 用 bubbleDowm 实现 优先 级 队列 的 aeletemax 操 作 。 
deletemax 国 数 接受 数组 4 和 指 癌 堆 中 当前 元 素数 z 的 指针 pz 作为 参数 。 这 里 省 略 了 对 zz>0 的 
测试 。 

在 第 () 行 ， 将 根 节 点 处 要 删除 的 元 素 与 最 后 的 元 素 〈 在 AIn]l 中 ) 交换 。 技 术 上 讲 ， 应 该 
返回 删除 的 元 素 ， 不 过 ， 正 如 所 看 到 的 ， 将 其 放 和 人 不 再 属于 该 堆 的 Arn] 也 是 可 以 的 。 

在 第 (2) 行 ， 将 n 减 少 1， 实 际 上 就 是 删除 现在 处 于 旧 的 A [Ln] 中 的 最 大 元 素 。 因 为 现在 的 根 
节点 可 能 会 违背 偏 序 树 属性 ， 所 以 在 第 (3) 行 调用 bubbleDown (A,1,n)，, 它 会 递归 地 将 违背 偏 
序 树 属性 的 元 素 向 下 压 ， 直 到 该 元 素 到 达 一 个 不 再 小 于 它 子 节点 的 位 置 或 是 成 为 叶子 节点 ， 不 
管 哪 种 情况 ， 都 不 再 会 违反 偶 序 树 属 性 了 。 






































void deletemax(int A[], int *pn) 


{ 

(1) swap(A, 1, *pn); 

(2) --(*pn) ; 

(3) bubbleDown (A, 1, *pn); 
上 





图 5-49 ”用 堆 实 现 的 优先 级 队列 aeletmax 操 作 


+ 示例 5.31 
假设 对 图 5-45 中 的 堆 执 行 Geletemax 操 作 。 在 交换 了 4[1] 和 4[10] 之 后 ， 将 n 置 为 9。 这 样 堆 
就 变 成 了 


] 2 3 4 5 6 7 8 9 
[| | | 
在 执行 bubbleDown (A,1,9) 时 , 会 将 chil4 置 为 2。 因为 4[2] 宇 4[3], 所 以 在 图 5-48 的 第 (3) 
行 不 用 增加 chil4。 然 后 ， 因 为 chil4n 而 且 4[1] < 4[2]， 所 以 交换 这 两 个 元 素 ， 得 到 数组 


1 2 3 4 5 6 7 8 9 
| | 
接着 调用 bubbleDown (A,2,9)。 这 要 求 我 们 在 第 (2) 行 对 4[4] 和 4[5] 加 以 比较 ， 比 较 的 结 
果 是 前 者 更 大 。 因 此 ， 在 图 5-48 的 第 (4) 行 ，chil4d =4。 又 因为 可 知 4[2] < 4[4]， 所 以 交换 这 两 个 
元 素 ， 并 对 如 下 数组 调用 bubbleDown (A,4,9)。 
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1 2 3 4 5 6 2 8 9 
lI? || 3|7| 
再 下 来 要 比较 4[8] 和 4[9], 结果 后 者 更 大 ,所 以 bubbleDown (A, 4,9) 的 第 (4) 行 有 child= 9。 
为 4[4] < 4[9]， 所 以 再 次 进行 交换 ， 得 到 数组 


1 2 3 4 9 0 7 8 9 
ER 
随后 调用 bubbleDown (A,9,9)。 在 第 (1) 行 将 chil4 置 为 18， 而 且 因 为 child < n 为 假 ， 第 @Q2) 
行 的 第 一 个 测试 会 失败 。 同 样 ， 第 (4) 行 的 测试 也 会 失败 ， 所 以 不 用 再 进行 交换 或 递归 调用 。 这 
一 数组 现在 已 经 是 还 原 偏 序 树 属性 的 堆 了 。 


5.9.4 ”优先 级 队列 操作 的 运行 时 间 


优先 级 队列 堆 实现 的 每 次 插入 或 deletemax 操 作 的 运行 时 间 是 O(logn) 。 要 知道 原因 , 首先 
考虑 一 下 图 5-47 所 示 的 insert 程 序 。 该 程序 前 两 步 花 的 时 间 显 然 是 0(1) ， 此 外 还 要 加 上 对 
bubbleUp 的 调用 所 花 的 时 间 。 因 此 ， 需 要 确定 bubbleUp 的 运行 时 间 。 

粗略 地 讲 ， 我 们 注意 到 每 次 pubpbleUp 递 归 调 用 自身 时 ， 就 是 离 根 节 点 更 近 了 一 个 节点 的 位 
置 。 因 为 平衡 偏 序 树 的 高 度 大 约 是 log, n ， 所 以 递归 调用 的 次 数 是 OUdog, n) 。 因 为 对 bupbleUp 
的 每 次 调用 花 的 时 间 是 0() 外 加 递归 调用 的 时 间 ( 如 果 有 的 话 )， 所 以 总 时 间 应 该 为 O(logn) 。 

更 严格 地 讲 , 设 7TQ) 是 pubbleUp (A, i) 的 运行 时 间 , 那么 可 以 构建 如 下 7Q) 的 递 推 关系 。 

依据 。 如果 i=1, 那么 7T(i) 是 0() , 因为 很 容易 看 出 , 在 这 种 情况 下 , 图 5-46 中 的 bubbleUp 
程序 不 会 执行 任何 递归 调用 ， 只 是 执行 了 if 语句 的 测试 。 

归纳 。 如 果 过 1 ， 那么 if 语句 的 测试 可 能 会 失败 ， 因 为 4[ 四 不 再 需要 继续 上 升 了 。 知 该 测试 
成 功 , 则 花 OQ) 的 时 间 执 行 swap， 并 以 参数 i/2 (车; 为 奇数 则 略 小 于 i/2 ) 递归 调用 bubbleUp 
一 次 。 因 此 7T(i) 志 7(Gi/2)+0()。 

所 以 可 以 说 ， 对 于 某 些 常数 a 和 bp， 递 推 关系 

T(D)=a 
TQ)=7T(i/ 2)+b, i >1, 
能 作为 bubbleUp 运 行 时 间 的 上 界 。 如 果 将 7T(i/2) 展开 ， 就 得 到 ， 对 每 个 ， 有 
TG)=T(i/ 27) +pj (5.2) 

如 3.10 节 中 那样 ， 可 以 对 ;的 值 加 以 选择 ， 使 得 7T(i/27 最 为 简单 。 在 这 种 情况 下 ， 可 以 令 j 等 于 
log, i ， 这 样 一 来 i/27 =1 。 因 此 ，($.2) 式 就 成 了 7(G) =atblogzi, 也 就 是 说 7(i) 是 O(logi) 。 因 为 
bubbleUp 的 运行 时 间 是 O(logi) ， 所 以 插入 操作 的 运行 时 间 也 是 O(logi) 。 

现在 考虑 deletemax。 从 图 5-49 中 可 以 看 出 ，4deletemax 的 运行 时 间 是 0() 加 上 bubbleDown 
的 运行 事件 。 对 图 5-48 所 示 bubbleDown 了 兄 数 的 分 析 基 本 上 与 对 bubbleUp 的 分 析 相 同 。 这 里 


二 > 六 一 二 


就 不 再 袭 述 分 析 过 程 ， 直 接 得 出 bubpleDown 和 deletemax 的 运行 时 间 也 是 O(logn) 这 一 结论 。 



































5.9.5 ”习题 


(1) 考虑 图 5-45 中 的 堆 ， 说 明 在 下 列 情况 下 分 别 会 发 生 什么 。 
(a) 插入 3 
(b) 插入 20 
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(c) 删除 最 大 元 素 
(d) 再 次 删除 最 大 元 素 

(2) 通过 对 ;的 归纳 证 明 (5.2) 式 。 

(3) 通过 对 违背 偏 序 树 属性 的 节点 的 深度 进行 归纳 ， 证 明 图 5-46 中 的 bulbbleUp 消 数 可 以 正确 地 将 有 
一 处 违背 偏 序 树 属性 的 树 还 原 为 具有 偏 序 树 属性 的 树 。 

(4) 证 明 : 如 果 和 A 之 前 是 大 小 为 n--1 的 堆 ， 那 么 ijnsert (A,x,n) 也 数 可 以 使 A 变 为 大 小 为 n 的 堆 。 

(5) 通过 对 违背 偏 序 树 属性 的 节点 的 高 度 进行 归纳 ， 证 明 图 5-48 中 的 bubbleDown 函 数 可 以 正确 地 将 
有 一 处 违背 偏 序 树 属性 的 树 还 原 为 具有 偏 序 树 属性 的 树 。 

(6) 证 明 : deletemax (A,n) 可 以 让 大 小 为 的 堆 变 为 大 小 为 n 一 1 的 堆 。 如 果 A 之 前 不 是 堆 ， 会 发 生 
什么 ? 

(7) 证 明 : bupbleDown (A,1,n) 人 处 理 长 度 为 n 的 堆 所 花 时 间 是 O(logn) 。 

(8) ** 随机 选 出 不 同 优先 级 的 n 个 元 素 构 成 堆 ， 该 堆 是 偏 序 树 的 概率 是 多 少 ? 如 果 没 法 总 结 出 一 般 规 
则 ， 就 编写 递归 函数 计算 这 一 表示 为 n 的 函数 的 概率 。 

(9) 实现 偏 序 树 不 一 定 要 使 用 堆 。 假 设 使 用 之 前 用 于 二 叉 树 的 常规 的 左 子 节 点 右 子 节点 数据 结构 。 展 
示 如 何 使 用 这 一 结构 实现 bubbleDown、insert 和 deletemax 隐 数 。 

(10)* 二 又 查找 树 也 可 以 用 作 优 先 级 队列 的 抽象 实现 。 展示 如 何 使 用 具有 左 子 节 点 右 子 节点 数据 结构 
的 二 义 查 找 树 实现 插入 和 aqeletemax 操 作 。 这 些 操作 在 最 坏 情 况 下 以 及 在 一 般 情况 下 的 运行 时 
间 分 别 是 多 少 ? 


5.10” 堆 排序 ， 利用 平衡 偏 序 树 排 序 


现在 要 介绍 被 称 为 堆 排序 的 算法 。 它 会 分 两 个 阶段 为 数组 A[1. .n] 排 序 。 在 第 一 个 阶段 ， 
堆 排 序 会 给 4 偏 序 树 属性 。 堆 排序 的 第 二 个 阶段 会 反复 从 堆 中 选 出 剩余 元 素 中 的 最 大 元 素 ， 直 
到 堆 只 由 最 小 的 元 素 构 成 ,这样 就 完成 了 对 数组 4 的 排序 。 


1 1 | 


1 i n 
图 5-50” 堆 排序 过 程 中 数组 4 的 情况 


图 5-50 展 示 了 处 于 第 二 阶段 的 数组 4。 数组 的 开头 部 分 具有 偏 序 树 属性 , 而 剩 下 的 部 分 则 是 
以 非 递减 次 序 排 好 序 的 元 素 。 此 外 , 已 排序 部 分 是 数组 中 前 一 大 的 元 素 。 在 第 二 阶段 ，; 的 值 
可 以 从 n 减 到 1， 从 而 让 一 开始 为 整个 数组 4 的 堆 ， 最 终 减少 到 只 剩 下 位 于 A[1] 的 最 小 元 素 。 更 
详细 地 讲 ， 第 二 阶段 由 如 下 步骤 组 成 。 

(1) 将 A[1. .i] 中 最 大 元 素 4[1] 与 4 四 交换 ,因为 A[i+1. .n] 中 所 有 元 素 都 不 小 于 AI1. .i] 
中 的 元 素 ， 而 且 我 们 刚刚 将 Ar1. .i] 中 最 大 的 元 素 移 动 到 了 位 置 ;， 所 以 可 知 A[i..n] 是 数组 
中 前 n-i-1 大 的 元 素 ， 而 且 已 经 是 排 好 次 序 的 。 

(2) 的 值 是 递减 的 ， 每 次 将 堆 的 大 小 减少 1。 

(3) 通过 下 压根 节点 处 的 元 素 ( 就 是 刚 移动 到 4[1] 的 元 素 )， 还 原 开头 部 分 的 偏 序 树 属性 。 
+ 示例 5.32 

考虑 图 5-45 中 的 数组 ， 它 是 具有 偏 序 树 属性 的 。 这 里 从 第 二 阶段 的 第 一 次 迭代 开始 分 析 。 
在 第 一 步 中 ， 要 将 4[1] 与 4[10] 交 换 ， 得 到 : 
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1 2 3 4 5 6 7 8 9 10 
6l9|7111913|71| 
第 二 步 是 将 堆 的 大 小 减 小 为 9， 而 第 三 步 则 是 通过 调用 pubbleDown (1) 还 原 前 9 个 元 素 的 
偏 序 树 属性 。 在 这 次 调用 中 ，4[1] 和 4[2] 进 行 了 交换 。 


1 2 3 4 5 6 7 8 9 10 
|s|ws|07| 1 9317 

接着 ，4[2] 与 4[4] 进 行 了 交换 。 

1 2 3 4 5 6 7 8 9 10 

lolw| 57 7 3)7| 


最 后 ，4[4] 和 4[9] 交 换 : 





1 2 3 4 4 6 7 8 9 10 
9 1461717119| ss |a8. 
至 此 ,A[1..9] 具 有 了 偏 序 树 属性 。 
第 二 阶段 的 第 二 次 迭代 首先 要 交换 4[1] 中 的 元 素 18 与 4[9] 中 的 元 素 5, 在 将 5 往 下 压 到 合适 位 
置 后 ， 数 组 就 成 了 


1 2 3 4 和 6 了 8 9 10 
9 19 11771115|3|8| 
到 这 里 ， 数 组 中 最 后 两 个 元 素 已 经 是 最 大 的 两 个 元 素 ， 而 且 是 已 经 排 好 次 序 的 。 
第 二 阶段 会 不 断 继续 ， 直 到 完成 对 数组 的 排序 。 


1! 2 3 4 5 6 7 8 9 10 
ss)7| 7 sl lw ls|s 
5.10.1 数组 的 堆 化 
可 以 非 正式 地 将 堆 排 序 描 述 为 : 


for (i = 1; i <= n; i++) 
insert(ai); 

for (i = 1; i <= n; i++) 
deletemarx 


要 实现 这 一 算法 ， 先 将 待 排 序 的 n 个 元 素 a1!/、a，、…、ai 插 入 一 个 最 初 为 空 的 堆 中 。 然 后 执行 n 
次 aeletemax 操 作 ， 按 从 大 到 小 的 次 序 取出 元 素 。 图 5$-50 所 示 的 安排 让 我 们 可 以 随 着 数组 中 堆 
部 分 的 萎缩 ， 在 数组 的 尾部 存储 已 删除 的 元 素 。 

我 们 已 经 在 5.9 节 中 论证 过 插入 和 deletemax 操 作 的 运行 时 间 都 是 O(logn) ， 而 且 每 种 操作 
显然 都 要 执行 ?2 次 ， 所 以 这 是 一 种 可 与 归并 排序 媲美 的 O(nlogn) 排序 算法 。 其 实 ， 在 只 需要 最 
大 的 几 个 元 素 ， 而 不 需要 整个 已 排序 表 的 情况 下 ， 堆 排序 还 能 优 于 归并 排序 。 原 因 在 于 ， 要 让 
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数组 变 成 堆 ， 如 果 使 用 图 5-51 所 示 的 heapify 函 数 ， 只 需要 O(n) 的 时 间 就 能 完成 ， 而 不 是 
O(nlogn)。 








void heapify(int A[], int n) 
{ 


int i; 


for (i = n/2; i >= 1; i-- 
bubbleDown (A, i, n); 








图 5-51 ”数组 的 堆 化 


5.10.2 Heapify 的 运行 时 间 


首先 , 图 5-51 中 对 bublbleDown 的 n/2 次 调用 总 时 间 看 起 来 应 该 是 O(nlogn) ,因为 我 们 了 解 
的 bubbleDown 运 行 时 间 上 界 只 有 logn 这 一 个 。 不过， 如 果 利 用 向 下 压 元 素 的 序列 大 多 非常 短 
这 一 事实 ， 就 可 以 得 到 更 紧 的 边界 一 一 O(n) 。 

一 开始 , 甚至 都 不 必 堆 数组 的 后 半 部 分 调用 pubpbleDown, 因为 那里 的 节点 全 部 是 叶子 节点 。 
如 果 数 组 的 第 二 个 四 分 之 一 部 分 一 一 也 就 是 A[ (n/4) +1. .n/2] 一 一 中 的 元 素 存在 比 它 们 的 子 节 
点 小 的 ,就 可 以 调用 bubbleDowr 一 次 。 不 过 , 它们 的 子 市 点 是 在 数组 后 半 部 分 ， 都 是 叶子 节点 ， 
因此 ， 在 4 的 第 二 个 四 分 之 一 中 ， 最 多 调用 一 次 bubbleDown。 同 样 ， 在 数组 的 第 二 个 八 分 之 一 
中 ， 最 多 调用 两 次 pubbleDown。 在 数组 个 区 域 中 调用 bubbleDown 的 次 数 如 图 5-52 所 示 。 


n/l6 n/8 n/4 n/2 n 


‘Ca 


图 5-52 ” 随 着 数组 下 标 不 断 变 大 ， 对 bubbleDown 的 调用 次 数 迅 速 减少 


现在 来 计算 一 下 heapify 调 用 了 多 少 次 bubbleDown， 其 中 包括 递归 调用 。 从 图 5-52 可 看 
出 ， 可 以 将 A 分 为 若干 个 区 段 ， 其 中 第 个 区 段 是 由 大 于 n/2" 且 不 大 于 n/2’ 的 /对 应 的 AI] 组 
成 。 因 此 ， 区 段 中 的 元 素数 就 是 n/2*” ， 而 且 区 段 中 每 个 元 素 至 多 调用 i 次 bubbleDown。 此 
外 ，i> log,n 的 区 段 都 为 空 ， 因 为 它们 至 多 包含 n/2">”=1/2 个 元 素 。A[1] 是 区 段 log,n 中 
唯一 的 元 素 ， 因 此 需要 计算 和 值 


















































> 12 (5.3) 
将 (5.3) 的 有 限 和 扩展 为 无 限 和 ， 并 提取 出 因 式 n/2 ， 就 可 以 给 出 该 和 值 的 上 界 
2 Pi/2 (5.4) 


现在 必须 得 出 (5.4) 式 中 和 值 的 上 界 。 》%i/2 可 以 写 为 
(1/2)+(/4+1/4)+(1/8+1/8+1/8)+(1/16+1/16+1/16+1/16)+*… 
可 以 将 这 些 2 的 乘 方 的 倒数 写 为 如 图 $-53 所 示 的 三 角形 。 每 一 行 都 是 公 比 为 1/2 的 无 穷 几 何 级 
数 ， 而 其 和 则 是 级 数 中 第 一 项 的 两 倍 ， 正 如 图 $-33 右 侧 所 示 。 各 行 之 和 又 形成 了 另 一 个 几何 级 
数 ， 而 它 的 和 是 2。 
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1/2+1/4+1/8+1/16+*…=1 
1/4+1/8+1/16+*…=1/2 
1/8+1/16+*…=1/4 
1/16+*…=1/8 








图 5-53 将 》 2%i/2' 排列 为 三 角 和 





这 样 一 来 ，(5.4) 的 上 界 为 (n/2)x2=n。 也 就 是 说 ， 在 函数 heapify 中 调用 bubbleDown 
的 次 数 不 超 过 n。 因 为 已 经 得 出 每 次 调用 花费 的 时 间 为 0() , 不 含 任何 递归 调用 ， 所 以 可 以 得 出 
结论 : heapify 花 的 总 时 间 为 O(n) 。 
5.10.3 ”完整 的 堆 排 序 算 法 


堆 排 序 C 语 言 程序 如 图 5-54 所 示 。 它 使 用 整数 数组 A [1 . .MAX] 表 示 堆 。 待 排序 的 元 素 被 插 
入 AI1..n] 中 。 图 $-$4 中 国 数 声明 的 定义 包含 在 $.9 节 和 5$.10 节 中 。 





#include <stdio .h> 
#define MAX 100 


int ALMAX+1] ; 


void bubbleDown(int A[], int i, int n); 
void deletemax(int A[], int *pn); 

void heapify(int A[], int n); 

void heapsort(int A[], int n); 

void swap(lint A[], int i, int j); 


main() 
{ 


int i, n, XxX; 


n= 0; 
While (Cn < MAX && scanf ("%d", &x) != EOF) 
A[++n] = xX; 
heapsort (A, n); 
for (i = 1; i <= n; i++) 
printf("%d\n", A[i]); 
} 


void heapsort(int A[], int n) 
{ 


int i; 


heapify(A, n); 

i = n; 

while (i > 1) 
deletemax(A, &i);, 





图 5-54 ”对 数组 进行 堆 排 序 


第 (1) 行 调用 heapify， 它 将 竺 排序 的 n 个 元 素 变 成 一 个 堆 。 第 (2) 行 将 标记 堆 尾 的 i 初始 化 
为 n。 第 (3) 和 第 (4) 行 的 循环 将 Geletemax 应 用 n 一 1 次 。 我 们 应 该 重新 审视 图 5-49 中 的 代码 ， 会 
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看 到 deletemax (A,i) 会 将 当前 堆 中 最 大 的 元 素 ( 永远 是 A[1] ) 与 4[i] 交 换 。 这 样 一 来 ，i 每 
次 会 减少 1, 所 以 扒 的 大 小 也 会 缩小 1。 在 第 (4) 行 被 el etemax“ 删 除 ” 的 元 素 现在 成 为 数列 已 
排序 尾部 的 一 部 分 。 它 不 大 于 之 前 的 尾部 A[i+1. .n] 中 的 任何 元 素 , 而 不 小 于 仍 在 堆 中 的 任意 
元 素 。 因 此 ， 声 明 的 属性 得 到 保持 ， 堆 中 的 所 有 元 素 都 先 于 尾部 的 所 有 元 素 。 


5.10.4 扒 排 序 的 运行 时 间 


刚刚 已 经 确定 了 第 (1) 行 中 的 heapify 函 数 花 的 时 间 与 a 成 比例 。 第 (2) 行 显然 紫 了 00) 的 
时 间 。 因 为 第 (3) 行 和 第 (4) 行 的 循环 每 进行 一 次 ，; 就 减少 1， 所 以 循环 要 进行 2-1 次 。 第 (4) 行 
中 对 aeletemax 的 调用 花 的 时 间 是 OUdogm 。 因 此 ， 整 个 循环 的 总 运行 时 间 为 O(zlog 门 。 这 
一 时 间 主 导 了 第 (1 行 和 第 (2) 行 的 运行 时 间 ， 所 以 heapsort 国 数 处 理 z 个 元 素 的 运行 时 间 是 
O(nlogn)。 

















5.10.5 习题 


(1) 对 3、1、4、1、5、9、2 、6、5 这 列 元 素 应 用 堆 排 序 。 
(2)* 给 出 一 个 运行 时 间 是 O(n) 的 算法 ， 使 其 从 具有 7 个 元 素 的 表 中 找 出 前 Vn 大 的 元 素 。 


5.11 小结 


读者 应 该 从 本 章 中 获取 如 下 要 点 。 

口 树 是 一 种 用 于 表示 层次 化 信息 的 重要 数据 模型 。 

口 多 种 涉及 数组 和 指针 结合 的 数据 结构 可 用 于 实现 树 ， 选 择 何 种 数据 结构 取决 于 要 对 树 进 
行 哪 种 操作 。 

口 树 节 点 最 重要 的 两 种 表示 分 别 是 最 左 子 节点 右 匈 弟 节 点 表示 和 单词 查找 树 〈 指向 子 节 点 
的 指针 数组 )。 

D 递归 算法 和 证 明 也 适用 于 树 。 结 构 归 纳 法 是 普通 归纳 模式 的 一 种 变形 ， 可 以 有 效 地 对 树 
中 的 节点 数 进行 完全 归纳 。 

D 二 又 树 是 树 模型 的 一 种 变形 ， 它 的 每 个 节点 最 多 可 以 有 左 子 节 点 和 右 子 节 点 。 

口 二 又 查找 树 是 带 标号 的 二 叉 树 ,， 它 具有 “二 又 碍 找 树 属 性 ”， 即 节点 左 子 树 的 所 有 标号 都 


























先 于 该 节点 的 标号 ， 而 且 节 点 右 子 树 的 所 有 标号 都 后 于 该 节点 的 标号 。 
口 词典 抽象 数据 类 型 是 可 以 对 其 执行 持 入、 删除 和 查找 操作 的 集合 。 二 又 查找 树 可 以 有 效 
地 实现 词典 。 


口 优先 级 队列 是 男 一 种 抽象 数据 类 型 ， 是 可 以 对 其 执行 插入 和 deletemax 操 作 的 集合 。 

口 偏 序 树 是 种 带 标 号 的 二 又 树 ， 它 具有 任意 节点 的 标号 都 不 小 于 其 子 节 点 标号 的 属性 。 

口 平衡 偏 序 树 除 最 下 层 之 外 的 各 层 都 被 节点 占 满 ， 而 最 下 层 只 有 靠 左 侧 的 位 置 被 占据 ， 它 
可 以 通过 被 称 为 堆 的 数组 结构 实现 。 这 一 结构 提供 了 一 种 复杂 度 为 O(logn) 的 优先 级 队 
列 实现 ， 并 带 来 了 一 种 复杂 度 为 O(nlogn) 的 排序 算法 一 一 堆 排 序 。 


5.12 参考 文献 
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第 6 草 





和 树 一 样 ， 表 也 是 计算 机 程序 中 最 基础 的 数据 模型 之 一 。 从 某 种 意义 上 讲 ， 表 就 是 树 的 简 
化 形式 ， 因 为 大 家 可 以 将 表 视 为 每 个 左 子 节点 都 是 叶子 节点 的 二 又 树 。 不 过 ， 表 还 能 表示 其 他 
一 些 方面 ， 这 些 方面 与 我 们 之 前 了 解 的 关于 树 的 那些 情况 不 同 。 例 如 ， 我 们 将 要 谈论 对 表 的 操 
作 ， 比 如 压 入 和 弹出 ， 这 是 没 法 用 树 来 模拟 的 ; 而 且 要 探讨 字符 串 ， 这 种 特殊 而 重要 的 表 需 要 
它们 自己 的 数据 结构 。 


6.1 本草 主要 内 容 


6.2 节 介绍 了 与 表 有 关 的 术语 。 本 章 其 余部 分 将 介绍 以 下 主题 。 

口 表 的 基本 操作 (6.3 节 )。 

口 由 链表 数据 结构 ( 6.4 节 ) 和 数组 数据 结构 ( 6.5 节 ) 实现 的 抽象 表 。 

口 栈 : 只 能 从 一 端 插 入 和 删除 的 表 (6.6 节 )。 

口 队列 : 从 一 端 搬入 从 另 一 端 删除 的 表 〈6.8 节 )。 

口 字符 串 和 用 来 表示 字符 串 的 特殊 数据 结构 ( 6.10 节 )。 

此 外 ， 我 们 还 将 详细 研究 表 的 两 类 应 用 。 

口 运行 时 栈 ，C 语 言 以 及 其 他 多 种 语言 用 来 实现 递归 函数 的 方法 (6.7 节 )。 

口 找 出 两 个 字符 串 最 长 公共 子 序列 的 问题 ， 及 其 通过 “动态 规划 ”( 或 者 说 填 表 ) 算法 得 出 
的 解决 方案 (6.9 他 )。 


6.2 基本 术语 


表 是 由 0 个 或 多 个 元 素 组 成 的 有 限 序列 。 如 果 这 些 元 素 全 是 7 类 型 的 ， 那么 就 说 该 类 型 的 表 
是 “7 表 ”。 因 此 ， 就 有 整数 表 、 实 数 表 、 结 构 体 表 、 整 数 表 的 表 ， 等 等 。 一 般 可 以 预期 列表 的 
元 素 都 是 某 一 类 型 的 。 不 过 ， 因 为 一 种 类 型 可 以 是 多 种 类 型 的 联合 ， 所 以 单一 “类 型 ”的 限制 
是 可 以 绕 开 的 。 

表 通 常 表示 为 用 去 号 分 隔 表 中 各 元 素 ， 并 用 一 对 圆 括号 将 这 些 元 素 括 起 来 ， 如 


(al， CD2，”””， dn) 




















其 中 都 是 表 中 的 元 素 。 
在 某 些 情况 下 ， 我 们 将 不 会 把 逗号 和 括号 写 出 来 。 特 别 要 说 的 是 ， 我 们 将 要 研究 字符 串 ， 
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也 就 是 由 字符 组 成 的 表 。 字 符 串 一 般 不 会 写 上 逗号 或 其 他 分 隔 符 号 ， 而 且 不 会 用 括号 括 起 来 。 
字符 串 的 元 素 通常 都 是 用 等 宽 字体 表示 的 。foo 就 是 由 3 个 字符 组 成 的 表 ,， 其 中 第 一 个 字符 为 f， 
而 第 二 和 第 三 个 字符 都 是 o。 


+ 示例 6.1 
下 面 是 一 些 表 的 例子 。 
(1) 小 于 20 的 质数 按照 从 小 到 大 的 顺序 组 成 的 表 : 
“本 
(2) 稀有 气体 元 素 按照 原子 量 从 小 到 大 的 顺序 排列 组 成 的 表 : 


向 


( 儿 ， 扬 ， 氢 ， 克 ， 低 ， 和 氟 ) 

















(3) 平年 各 月 天 数组 成 的 表 : 
(31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31) 
这 个 例子 提醒 我 们 ， 同 一 元 素 可 以 在 某 个 表 中 出 现 多 次 。 


示例 6.2 

一 行文 本 是 表 的 另 一 个 例子 。 组 成 这 行文 本 的 单个 字符 就 是 表 中 的 元 素 ， 所 以 该 表 就 是 个 

字符 串 。 该 字符 串通 常会 包含 若干 空 字符 ， 而 且 一 行文 本 的 最 后 一 个 字符 通常 是 “换行 ” 符 。 
再 举 一 个 例子 ， 文 档 也 可 视 作 表 。 这 种 情况 下 ， 表 中 的 元 素 就 是 文本 行 。 因 此 ， 文 档 就 是 

由 表 作 为 元 素 组 成 的 表 ， 具 体 说 来 这 些 作 为 元 素 的 表 都 是 字符 串 。 


+ 示例 6.3 


二 




















素 表 示 x 和 坐标 (水 平方 向 )， 第 二 个 表示 y 和 坐标 ( 向 页 内 方向 )， 第 三 个 表示 z 坐 标 ( 垂直 方向 )。 


(0,1,1) 


(1,1,1) 





,< (0,1,0) (1,1,0) 





(0.0.0) (1,0,0) 
图 6-1 表示 为 三 元 组 的 单位 正方 体 顶 点 


6.2.1 表 的 长 度 
表 的 长 度 是 指 元 素 在 表 中 出 现 的 次 数 。 如 果 表 中 元 素数 为 0, 那么 就 说 该 表 为 空 表 。 我 们 用 
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希腊 字母 e( 音 “ 伊 普 西 龙 ”) 表示 空 表 。 还 可 以 用 一 对 不 包含 任何 内 容 的 圆 括号 0 表示 空 表 。 
谨 记 , 长 度 是 按 位 置 计算 而 不 是 按 不 同 符号 计算 的 , 所 以 在 表 中 出 现 砍 的 某 一 符号 可 以 为 表 增 
加 长 度 。 


+ 示例 6.4 
示例 6.1 中 表 () 的 长 度 是 g8， 而 表 (2) 的 长 度 是 6。 表 (3) 的 长 度 为 12， 因 为 每 个 月 都 要 占据 一 
个 位 置 。 而 表 中 只 有 3 个 元 素 这 一 事实 对 表 的 长 度 来 说 是 无 关 紧 要 的 。 


6.2.2” 表 的 部 分 


如 果 表 非 空 ， 那 么 它 就 是 由 称 为 表 头 ( head ) 的 第 一 个 元 素 ， 以 及 称 为 尾部 〈tail ) 的 表 中 
其 余部 分 组 成 的 。 例如 , 示例 6.1 中 表 (2) 的 表 头 就 是 “ 氨 ”, 而 该 表 的 尾部 则 由 其 余 5 个 元 素 组 成 : 


向 


(和 氛 , 握 , 所 ,和 伟 ， 毛 ) 


























元 素 和 长 度 为 1 的 表 


谨 记 ， 衣 的 表 头 是 个 元 素 ， 而 表 的 尾部 却 是 表 。 此 外 ,我 们 不 应 该 将 表 的 表 头 (假如 为 a ) 
与 只 包含 ee 1 的 表 ( 通 常会 写 为 带 括号 的 (a) ) 混淆 。 如 果 元 素 q 是 7 类 型 的 ， 
那么 表 (q) 就 是 “7T 表 ”类 型 的 。 

如 果 不 色 a 就 可 能 在 用 数据 结构 实现 表 时 造成 编程 错误 。 例如 ， a 
用 互相 链接 的 单元 表示 表 ， 这 些 单 元 通常 是 结构 体 ， 具 有 存放 7 类 型 元 素 的 element 字 段 ，r 
及 存放 指向 下 一 单元 的 指针 的 next 字 段 。 那 么 Re 
的 element 字 段 和 存放 着 NULEL 的 next 字 段 的 单元 。 





如 果 有 表 工 = (aa,) , 则 对 满足 1 二 i < j 的 和) 来 说 , (a, qj,,…, a)) 是 L 的 子 表 。 
也 就 是 说 ， 子 表 是 由 从 某 个 位 置 开 始 到 某 个 位 置 ) 结 束 的 所 有 元 素 组 成 还 可 以 说 空 表 e 是 任 
何 表 的 子 表 。 

表 工 = (a, a,,…, a ) 的 子 序列 是 指 从 LL 中 殊 除 0 个 或 多 个 元 素 后 形成 的 表 。 剩 下 的 这 些 元 素 ， 
也 就 是 构成 子 序列 的 这 些 元 素 ， 必 须 按照 与 出 现在 LL 中 相同 的 顺序 排列 ， 不 过 子 序列 的 元 素 在 L 
中 不 一 定 是 连续 的 。 请 注意 ，e 和 表 L 本 身 总 是 L 的 子 序列 ， 而 有 目 L 的 子 表 也 是 L 的 子 序列 。 


+ 示例 6.5 

设 L 是 字符 串 apc， 那 么 L 的 子 表 有 

€, a, b, c, ab, bc, abc 

它们 也 都 是 ZL 的 子 序列 。 除 此 之 外 ，ac 也 是 子 序列 ,但 它 不 是 子 表 。 

再 举 个 例子 ， 设 L 是 字符 串 apab， 那 么 子 表 就 有 

E€, a, b, ab, ba, aba, bab, abab 

这 些 也 是 L 的 子 序列 。 除 此 之 外 ，L 还 有 子 序列 aa，bb，aab，abb。 请 注意 ，pba 这 样 的 字符 
串 不 是 L 的 子 序列 。 即 便 工 中 确实 有 两 个 b 和 一 个 a， 但 它们 在 ZL 中 出 现 的 顺序 ， 不 能 让 我 们 通过 
从 Z 中 剔除 某 些 元 素 构成 bba。 也 就 是 说 ， 在 上 中 ， 第 二 个 b 后 面 是 没有 a 的 。 

表 前 绥 是 指 从 表 的 开头 开始 的 任意 子 表 。 表 后 缓 则 是 以 表 的 结尾 为 未 尾 的 子 表 。 空 表 e 是 种 
特殊 情况 ， 它 是 任意 表 的 前 级 和 后 级 。 
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+ 示例 6.6 
表 的 前 级 有 e，a，ab 和 apc， 而 它 的 后 缀 是 eE，c，bc 和 abc。 





Car 和 Cdr 


在 Lisp 语 言 中 ， 表 头 叫 作 car， 而 尾部 则 称 为 cdr ( 音 “cudder”)。 术 语 “car” 和 “cdr” 的 
名 字 来 源 于 IBM 709 型 计算 机 中 机 器 指令 的 两 个 字段 ，Lisp 最 早 就 是 在 该 型 计算 机 上 实现 的 。 
car 表 示 “contents of the address register”( 地 址 寄存 器 的 内 容 )， 而 cdr 则 表示 “contents of the 
decrement register”( 减 量 寄存器 的 内 容 )。 某 种 意义 上 讲 ， 存 储 字 (memory word ) 可 以 视 为 有 
着 element 和 next 字段 ( 分别 对 应 car 和 cdr ) 的 单元 。 





6.2.3 ” 表 中 元 素 的 位 置 


表 中 的 每 个 元 素 都 有 与 之 关联 的 位 置 。 如 果 有 表 (al, az ……, an)， 而 且 靖 过 1 ，al 就 是 第 一 个 
元 素 ，as 就 是 第 二 个 元 素 ， 以 此 类 推 , 而 a 则 是 最 后 一 个 元 素 。 还 可 以 说 a 出 现在 位 置 i。 除 此 
之 外 ，a; 是 在 qi 之后， 在 ql 之前。 而 存放 元 素 a 的 位 置 则 称 作 a 的 出 现 。 

表 中 位 置 的 数量 就 等 于 表 的 长 度 。 同 一 元 素 是 有 可 能 出 现在 两 个 或 多 个 位 置 的 ， 因 此 不 要 
把 位 置 和 出 现在 该 位 置 的 元 素 弄 混 了 。 例 如 ， 示 例 6.1 中 的 表 (3) 就 有 12 个 位 置 ， 其 中 有 7 个 存放 
着 31， 分 别 是 位 置 1、3、5、7、8、10 和 12。 


6.2.4 ”习题 
(1) 针对 表 (2，7，1，8，2) 回 答 以 下 问题 。 


(a) 它 的 长 度 是 多 少 ? 
(b) 它 的 前 级 有 哪些 ? 
(0) 它 的 后 绥 有 哪些 ? 
(d) 它 的 子 表 有 哪些 ? 
(6) 它 有 多 少 个 子 序列 ? 
(D 它 的 表 头 是 什么 ? 
(8) 它 的 尾部 是 什么 ? 
(h) 它 包含 多 少 个 位 置 ? 
(2) 对 字符 串 banana 重 复习 题 (1) 中 的 练习 。 
(3) ** 在 长 度 为 n 宇 0 的 表 中 ， 最 多 可 能 有 多 少 (a) 前 级 ，(b) 子 表 ;(c) 子 序列 ? 而 最 少 又 分 别 可 能 
多 少 ? 
(4) 如 果 表 /尾部 的 尾部 是 空 表 ， 那 么 [的 长 度 为 多 少 ? 
(5)* 胡 图 写 了 个 由 整数 表 组 成 的 表 ， 不 过 他 省 略 了 括号 ， 结 果 成 了 : 1，2，3。 而 这 可 以 表示 很 多 由 
表 组 成 的 表 ， 比 如 ((),(2,3)) 。 那 么 在 不 含 空 表 作为 元 素 的 情况 下 ， 所 有 可 能 的 表 都 有 哪些 ? 


6.3 ”对 表 的 操作 


可 以 对 表 执 行 多 种 不 同 的 操作 。 第 2 章 中 , 当 我 们 讨论 归并 排序 时 , 基本 问题 就 是 为 表 排 序 ， 
不 过 我 们 还 需要 将 表 一 分 为 二 ， 再 合并 两 个 已 排序 的 表 。 从 形式 上 讲 ， 为 表 (a1, a;,…, an) 排 序 
的 操作 就 是 将 表 蔡 换 为 由 其 元 素 的 排列 组 成 的 表 (51, b;,…,5,)， 其 中 bb 三 b, 三 … 三 b。 这 里 就 
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像 之 前 一 样 ， 夺 表示 元 素 的 次 序 关系 ， 比 如 整数 或 实数 的 “小 于 或 等 于 ”， 或 是 字符 串 的 词典 次 
序 。 合 并 两 个 已 排序 表 的 操作 是 用 给 定 的 两 个 表 构 建 一 个 包含 其 中 相同 元 素 的 已 排序 表 。 多 重 
性 必须 得 到 保持 ， 也 就 是 说 ， 如 果 某 个 元 素 a 在 给 定 的 两 个 表 中 出 现 了 次， 那么 得 出 的 表 中 a 
也 出 现 有 次 。 回 顾 2.8 市 就 能 看 到 对 表 的 这 两 种 操作 的 示例 。 


6.3.1 插入 、 删 除 和 查找 


回想 一 下 $.7 节 ,“ 词 典 ” 是 可 以 对 其 执行 插入 、 删 除 和 查找 操作 的 元 素 集合 。 集 合 与 表 之 
间 存 在 一 个 重要 区 别 。 虽 然 元 素 在 集合 中 绝 不 能 出 现 多 次 ， 但 正如 我 们 所 见 ， 元 素 在 表 中 可 出 
现 多 次 。 和 集合 的 问题 将 在 第 7 章 中 讨论 。 不 过 ， 表 可 以 实现 集合 ， 其 方式 是 将 集合 {a1, az ,ay} 
中 的 元 素 以 任意 次 序 放置 到 表 中 ， 例 如 次 序 (qi, qa2,…, ay)， 或 次 序 (qj, a ,1,…, ql)。 因 此 ， 如 果 
一 些 对 表 的 操作 与 对 集合 的 词典 操作 类 似 ， 应 该 不 会 让 人 感到 奇怪 。 

(1) 可 以 向 表 Z 中 搬 人 元 素 x。 从 原则 上 讲 ，x 可 能 出 现在 表 中 任何 位 置 ， 而 且 x 在 5 中 出 现 一 
次 或 多 次 都 是 没关系 的 。 我 们 通过 在 表 中 增加 一 次 x 的 出 现 来 搬入 x。 作 为 一 种 特例 ， 如 果 让 x 
作为 新 表 的 表 头 〈 这 样 一 来 Z 就 成 了 尾部 )， 就 是 将 xz* 压 入 表 Z 中 。 如 果 工 =(o,a…a) ， 那 么 
得 到 的 表 就 是 (x, al, qs,…, an)。 

(2) 可 以 从 表 Z 中 删除 元 素 x。 这 里 ， 是 从 Z 中 删除 xz 的 一 次 出 现 。 如 果 x 出 现 多 次 ， 那 么 就 要 
指出 删除 哪个 x。 例如 , 我 们 可 以 总 是 删除 第 一 个 xz。 如 果 想 要 删除 所 有 的 x,， 就 要 重复 删除 操作 ， 
直到 不 再 剩 下 xz 为 止 。 如 果 表 Z 中 未 出 现 zx， 那 么 删除 操作 就 不 会 造成 任何 影响 。 作 为 特例 ， 如 果 
是 删除 了 表 的 表 头 元 素 ， 使 表 (x, al a2,…, an) 变 成 了 (al az, …, am)， 就 说 是 弹出 表 。 

(3) 可 以 在 表 Z 中 查找 元 素 x。 这 一 操作 会 返回 TRUE 或 FALSE, 具体 取决 于 x 是 否 为 表 中 元 素 。 


+ 示例 6.7 

设 L 为 表 (1，2，3，2)。 如 果 我 们 选择 压 和 人 1， 也 就 是 将 1 插入 到 表 头 位 置 ， 则 insert(1，) 的 
结果 是 (1 ，1，2，3，2)。 而 硅 是 将 1 插入 到 末尾 ， 就 得 到 (1，2，3，2，1)。 此 外 ， 这 个 新 的 1 还 
可 以 被 放置 到 表 Z 内 部 3 个 位 置 中 的 任何 一 个 上 。 

如 果 删 除 表 中 第 一 个 2， 那 么 dejetemax(2， 刀 ) 的 结果 是 表 (1，3，2)。 寿 问 jookupGc， 刀 ， 则 
当 x 为 1、2 或 3 时 ， 答 案 为 TRUE， 而 当 x 为 其 他 值 时 ， 答 案 为 FALSE。 


6.3.2 ” 串 接 


要 串 接 表 上 和 表 MM， 就 是 以 Z 的 元 素 作为 开头 部 分 ， 后 面 接 上 M 的 元 素 形 成 新 表 。 也 就 是 说 ， 
如 果 工 = (@,q,…,4,) ， 而 M =(b,b,,…,b)， 那 么 L 和 M 的 串 接 LM 就 是 表 
(qi1, 02 0 D1, D2, ***, Dp) 


请 注意 ， 空 表 是 串 接 恒 等 的 。 也 就 是 说 ， 对 任何 表 Z 都 有 eZ =Le=L。 


+ 示例 6.8 
如 果 7 是 表 (1，2，3)，W 是 表 G，1， 那 LM 就 是 表 (1，2，3，3，1)。 如 果 7 是 字符 串 aog， 
而 1 是 字符 串 house， 那 ZW 就 是 字符 串 aoghouse。 


6.3.3” 表 的 其 他 操作 
另 一 类 对 表 的 操作 是 与 表 的 特定 位 置 相关 的 。 例 如 
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(a) 717st(D) 会 返回 表 7 的 第 一 个 元 素 〈 表 头 )， 而 first( 了 ) 会 返回 L 的 最 后 一 个 元 素 。 如 果 L 
是 空 表 ， 则 这 两 种 操作 都 会 导致 错误 出 现 。 
(b)retrieve(i，L 有 ) 操 作 会 返回 表 工 中 第 ;个 位 置 处 的 元 素 。 如 果 L 的 长 度 小 于 i， 就 会 出 错 。 
除 此 之 外 ， 还 有 涉及 表 的 长 度 的 操作 。 常 见 的 包括 下 列 两 种 。 
(c) length(L)， 返 回 表 L 的 长 度 。 
(d)isEmpty(L)， 如 果 工 为 空 表 则 返回 TRUE， 否 则 返回 FALSE。 而 isNotEmpty(L) 会 返回 相 
反 的 结果 。 


6.3.4 习题 


(1) 设 L 是 表 (3，1，4，1，5，9)， 回 答 下 列 问题 。 
(a) delete(5， 的 值 是 多 少 ? 
(bjdeiete(1 ， 刀 的 值 是 多 少 ? 
(c) 弹出 ZL 的 结果 是 什么 ? 
(qd) 将 2 压 人 表 L 的 结果 是 什么 ? 
(e) 如 果 以 元 素 6 和 表 工 执行 lookup， 会 返回 什么 ? 
(如果 MM 是 表 (6，7，8)， 那 么 LM ( 工 和 M 的 串 接 ) 的 值 是 多 少 ? ML 的 值 又 是 多 少 ? 
(g)first() 是 多 少 ?Iast( 有 ) 又 是 多 少 ? 
(h)retrieve(3，) 的 结果 是 多 少 ? 
(i) flengh( 了 的 值 是 多 少 ? 
0 isEmpty(L) 的 值 是 多 少 ? 

(2) ** 如 果 L 和 M 是 表 ， 在 什么 条 件 下 有 LM =ML? 

(3) ** 设 x 是 元 素 而 L 是 表 ， 那 么 在 什么 条 件 下 以 下 等 式 为 真 ? 
(a) delete(x, insert(x, L))=L 
(b) insert (x, delete(x, L))=L 
(c) first(L)= retrievell, L) 
(d) last(L)= retrieve(length(L), L) 








6.4 ”链表 数据 结构 


实现 表 的 最 简单 方式 就 是 使 用 链表 。 每 个 链表 单元 都 由 两 个 字段 构成 ， 一 个 字段 包含 着 表 
中 的 元 素 ， 另 一 个 字段 则 含有 指向 链表 下 一 单元 的 指针 。 简 单 起 见 ， 假 设 元 素 都 是 整数 。 我 们 
不 仅 能 使 用 具体 的 int 类 型 来 表示 元 素 的 类 型 ， 而 且 能 用 == 、< 等 标准 比较 运算 符 来 比较 元 素 。 
本 三 习题 将 会 启发 读者 编写 这 些 函 数 的 变 体 ， 使 其 能 处 理 任意 类 型 的 元 素 ， 而 元 系 的 比较 则 是 
由 用 户 定义 的 函数 进行 的 ， 比 如 测试 相等 性 的 eqg， 及 测试 x 在 次 序 上 是 否 先 于 y 的 L(x,y) ， 等 等 。 

接 下 来 ， 要 使 用 来 自 1.6 节 中 的 宏 : 

DefCell(int, CELL, LIST); 
它 可 展开 为 表示 单元 和 表 的 标准 结构 体 


typedef struct CELL *LIST; 
struct CELL { 

int element ; 

LIST next; 
5 
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请 注意 ，LIST 是 指向 单元 的 指针 类 型 。 实 际 上 ， 每 个 单元 的 next 字 段 既 指 向 下 一 个 单元 ， 也 
指向 表 中 剩余 的 所 有 部 分 。 

图 6-2 展 示 了 表示 抽象 表 工 = (a, a,,…, a,) 的 链表 。 每 个 单元 都 对 应 一 个 元 素 ， 元 素 aj 出 现 
在 第 i 个 单元 的 element 字 段 。 对 i= 1, 2,…, n 一 1 而 言 ， 第 i 个 单元 中 的 指针 是 指向 第 it1 个 单元 
的 ， 而 最 后 一 个 单元 中 的 指针 为 NULL， 表 示 这 是 表 的 末尾 。 在 表 之 外 是 个 名 为 L 的 指针 ， 它 指 
癌 该 表 的 第 一 个 单元 ，L 是 LIST 类 型 的 。 如 果 表 7 为 空 ，I 的 值 就 为 NULL。 


。 四 廿 | 


图 6-2 ”表示 表 工 = (a, a,,…, a,) 的 链表 














表 和 链表 
请 记 住 ， 表 是 一 种 抽象 模型 ， 或 者 说 是 数学 模型 。 而 链表 则 是 种 简单 的 数据 结构 ， 这 在 第 
1 章 中 提 到 过 。 虽 然 链表 是 实现 表 数 据 模 型 的 一 种 方式 ， 但 正如 我 们 所 见 ， 它 并 非 实 现 表 数 据 
模型 的 唯一 方式 。 无 论 如 何 ， 这 是 再 次 记 住 模型 与 实现 模型 的 数据 结构 之 间 区 别 的 良好 时 机 。 





6.4.1 词典 操作 的 链表 实现 


如 有 果 用 链表 表示 词典 ， 那 么 该 如 何 实现 操作 ? 以 下 对 词典 的 操作 是 在 5.7 节 中 定义 的 。 

(1) insert (x，D)， 将 元 素 x 插 入 词典 DD 中 ; 

(2) delete (x，D)， 从 词典 DD 中 删除 元 素 x; 

(3) lookup (x，D)， 确 定 元 素 x 是 否 在 词典 DD 中。 
我 们 将 看 到 ， 与 之 前 章节 中 讨论 过 的 二 又 查 找 树 相 比 ， 链 表 是 一 种 更 为 简单 的 实现 词典 的 数据 
结构 。 不 过 ， 在 使 用 链表 表示 时 ， 词 典 操 作 的 运行 时 间 不 像 使 用 二 义 查 找 树 时 那么 少 。 在 第 7 
莉 中 还 将 看 到 一 种 更 佳 的 表示 词典 的 方式 一 一 散 列 表 ， 它 利用 对 表 的 词典 操作 作为 子 例 程 。 

这 里 假设 我 们 的 词典 包含 的 是 整数 , 而 且 单 元 是 按照 本 节 开 头 那样 定义 的 。 那 么 词典 的 
类 型 就 是 LIST， 也 是 像 本 节 开 头 那 样 定 义 的 。 含 有 元 素 集合 {a, a,,…, a,} 的 词典 可 以 用 图 
6-2 中 的 链表 表示 。 还 有 很 多 其 他 的 表 可 以 表示 这 一 集合 ， 因 为 元 素 的 次 序 在 集合 中 是 无 关 
紧要 的 。 


6.4.2 ”查找 


要 执行 lookup(x，D)， 就 要 对 表示 DD 的 表 中 的 每 个 单元 加 以 检验 ， 看 看 它 是 否 存放 了 所 需 的 
元 素 x。 如 果 是 ， 就 返回 TRUE。 如 果 到 达 表 末 仍 未 发 现 z， 就 返回 FALSE。 一 如 之 前 那样 ， 定 义 
的 常量 TRUE 和 FALSE 表 示 常 数 1 和 0，BOOLEAN 则 表示 定义 的 类 型 int。 递归 函数 lookup (x,D) 
如 图 6-3 所 示 。 

如 果 表 的 长 度 为 x*:， 就 说 图 6-3 中 的 函数 所 花 的 时 间 为 O(n) 。 除 了 结尾 的 递归 调用 外 ， 
lookup 花 的 时 间 是 Od) 。 当 调用 执行 之 后 ， 剩 余 的 表 的 长 度 要 比 表 Z 的 长 度 小 1。 因 此 对 长 度 
为 n 的 表 执 行 ]ookup 要 花 上 O(n) 的 时 间 应 该 不 会 让 人 感到 意外 。 更 加 正式 地 讲 , 以 下 递 推 关 系 
给 出 了 当 第 二 个 参数 指向 的 表 L 长 度 为 x 时 1ookup 的 运行 时 间 。 
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BOOLEAN lookup(int x, LIST L) 
{ 


if (L == NULL) 
return FALSE ; 

else if (x == L->element) 
return TRUE; 

else 
return lookup(x, L->next); 








图 6-3 ”在 链表 中 查找 


依据 。7(0)= 0(Q) ， 因 为 当 Z 为 NULL 时 ， 没 有 进行 递归 调用 。 

归纳 。7T(n)=7T(n-D)+0(0)。 
正如 我 们 在 第 3 章 中 见 过 很 多 次 ， 这 一 北 推 关系 的 解 是 T(n) = O(n) 。 因 为 含 n 个 元 素 的 词典 是 用 
长 度 为 n 的 表 表 示 的 ， 所 以 对 大 小 为 n 的 词典 执行 查找 操作 所 花 的 时 间 也 是 O(n) 。 

不 地 的 是 ， 进 行 一 次 成 功 查 找 的 平均 时 间 也 与 4 成 比例 。 如 果 要 查找 的 元 素 x 确 定 在 DD 中 ， 
那么 x 在 表 中 位 置 的 期 望 值 为 (n+1)/2 。 也 就 是 说 ,x 会 等 可 能 地 出 现在 从 第 一 个 元 素 到 第 n 个 元 
素 中 的 任 一 位 置 。 因此, 递归 调用 lookup 的 次 数 的 期 望 值 是 (2+D712 。 因 为 每 次 调用 所 花 的 时 
间 是 OG) ， 所 以 平均 成 功 查 找 所 花 的 时 间 为 O(n) 。 当 然 ， 如 果 查 找 不 成 功 ,那么 在 到 达 表 未 并 
返回 FALSE 之 前 , 已 经 进行 了 全 部 n 次 调用 。 


6.4.3 ”删除 


从 链表 中 删除 元 素 x 的 函数 如 图 6-4 所 示 。 第 二 个 参数 pL 是 指向 表 L 的 指针 , 而 不 是 表 L 本 里 。 
这 里 使 用 了 “ 按 引用 调用 ”的 风格 ， 因 为 我 们 乔 望 aelete 可 以 从 表 中 删除 含有 zx 的 单元 。 随 着 
我 们 沿 着 表 疝 下 移动 ，pi 中 存放 着 一 个 指针 ， 它 指向 的 是 指向 “当前 ”单元 的 指针 。 如 果 在 第 
(2) 行 发 现 x 在 当前 单元 C 中 ， 就 接着 在 第 (3) 行 改变 指向 单元 C 的 指针 ,使 得 它 指向 该 表 中 紧 跟 在 
C 之 后 的 那个 单元 。 如 果 C 正 好 在 表 的 末尾 ， 之 前 指向 C 的 指针 就 成 了 NULL。 如 果 x 不 是 当前 的 
元 素 ， 那 么 在 第 (4) 行 就 递归 地 从 表 尾 删除 x。 

请 注意 ， 如 采 表 为 空 表 ， 那么 第 (1) 行 的 测试 会 使 该 函数 在 没有 任何 动作 的 情况 下 返回 。 这 
是 因为 x 不 会 出 现在 空 表 中 ， 而 我 们 不 需要 采取 任何 措施 来 从 词典 中 删除 x。 如 有 果 D 是 表示 词典 
的 链表 ， 那 么 调用 delete (x, &D) 就 会 初始 化 从 词典 D 中 删除 x 的 操作 。 
































void delete(int x, LIST *pL) 


(1) if ((*pL) != NULL) 

(2) if (x == (+*pL)->element) 

(3) (*pL) = (*pL)->next; 
else 


(4) delete(x, &((*pL)->next)); 








图 6-4 ”删除 元 素 
如 果 元 素 x 没 有 出 现在 表示 词典 DD 的 链表 中 ， 那 么 就 会 继续 癌 下 运行 直到 表 的 末端 ， 为 每 个 
元 素 花 上 00) 的 时 间 。 分 析 过 程 类 似 对 图 6-3 中 1ookup 气 数 的 分 析 ， 这 里 就 将 细节 留 给 读者 自 
己 来 分 析 吧 。 因 此 ， 如 果 D 有 nn 个 元 素 ， 那 么 删除 不 在 DD 中 的 元 素 所 花 的 时 间 是 O(n) 。 如 果 x 在 
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词典 D 中 ,那么 平均 下 来 ， 将 会 在 表 中 接近 中 点 的 位 置 遇 到 x。 因 此 ,平均 要 查找 (n+1)/2 个 单 
元 ， 而 成 功 删 除 操作 的 运行 时 间 也 是 0(n) 。 


6.4.4 插入 


问 链 表 中 插入 元 素 x 的 函数 如 图 6-5 所 示 。 要 插入 ， 需 要 确定 x 没有 出 现在 表 中 。 如 果 它 已 
经 在 表 中 ， 就 什么 都 不 用 做 。 如 果 x 示 出现， 就 必须 将 其 添加 到 表 中 。 将 x 添加 到 表 中 的 什么 位 
置 并 不 重要 , 不 过 图 6-5 中 的 函数 是 将 x 添加 到 表 的 末尾 。 在 第 (1) 行 检测 到 末尾 的 NULL 时 ， 就 确 
定 x 不 在 表 中 。 那 么 ， 第 (2) 到 第 (4) 行 就 会 将 x 添加 到 表 尾 。 

如 有 果 表 非 NULL， 第 (5) 行 就 会 检查 x 是 否 在 当前 单元 。 如 果 x 不 在 这 里 ， 第 (6) 行 就 会 对 表 的 
尾部 进行 递归 调用 。 如 果 在 第 (5) 行 就 找到 x, 那么 函数 ijnsert 就 会 终止 , 不 进行 任何 递归 调用 ， 
而 且 不 会 对 表 Z 造 成 任何 改变 。 调 用 insert (x, &D) 会 初始 化 将 x 插入 词典 D 的 操作 。 
































void insert(int x, LIST *pL) 
{ 


if ((*pL) == NULL) { 
(*pL) = (LIST) malloc(sizeof(struct CELL) ) ; 
(+*pL)->element = xXx; 


(*pL)->next = NULL ; 

} 

else if (x != (*pL)->element) 
insert (x, &((*pL)->next)); 





图 6-5 ”元 素 的 插入 


与 查找 和 删除 的 情况 一 样 ， 如 果 在 表 中 没有 找到 x， 就 会 到 达 表 的 末端 ， 花费 O(n) 的 时 间 。 
如 果 找 到 xz， 那么 平均 会 走 过 表 中 一 半 ”的 位 置 ， 而 且 平 均 而 言 仍 会 花 O(n) 的 时 间 。 


6.4.5” 带 重复 的 插入 、 查 找 和 删除 


如 有 果 在 执行 插入 操作 之 前 不 检查 x 是 否 出 现在 表 中 ,可 以 让 插入 操作 运行 得 更 快 。 不 过 ,这 
样 做 的 后 有 果 就 是 ， 在 表示 词典 的 表 中 可 能 有 茶 一 元 素 的 多 个 副本 。 

要 执行 词典 操作 inserl(x，D)， 只 要 创建 一 个 新 单元 ,将 x 放 进去 ,并 将 该 单元 压 人 表示 DD 的 
表 的 开头 即 可 。 这 一 操作 花费 0() 的 时 间 。 

查找 操作 就 和 图 6-3 中 所 示 的 一 模 一 样 。 唯 一 的 不 便 就 是 可 能 要 查找 更 长 的 表 ， 因 为 表示 词 
典 D 的 表 的 长 度 可 能 会 大 于 D 中 的 成 员 数 。 




















重 提 抽 象 和 实现 
大 家 可 能 会 感到 惊讶 ,我 们 在 表示 词典 的 表 中 使 用 了 重复 , 因为 抽象 数据 类 型 DICTIONARY 
被 定义 为 集合 ,而 集合 是 不 含 重 复 的 。 不过， 有 重复 的 并 不 是 词典 ,而 实现 词典 的 数据 结构 可 以 
有 重复 。 但 是 ， 即 便当 x 在 链表 中 多 次 现 身 ， 它 在 链表 表示 的 词典 中 也 只 会 出 现 一 次 。 








J 在 后 面 的 分 析 中 ， 当 说 到 长 度 为 x 的 表 的 中 点 时 , 将 会 使 用 “一半” 或 “n/2 ”这样 的 说 法 。 严格 地 说 ，(n +1)/2 
要 更 加 精确 。 
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删除 操作 稍 有 区 别 。 在 遇 到 含有 元 素 x 的 单元 时 ， 我 们 不 能 停止 对 x 的 查找 ， 因 为 表 中 可 能 
还 有 x 的 其 他 副本 。 因 此 ,就算 表 L 的 表 头 包含 x， 也 必须 将 x 从 LL 的 尾部 删除 。 这 样 一 来 ,我们 不 
只 要 处 理 更 长 的 表 ， 而 且 要 实现 成 功 的 删除 操作 ， 就 必须 查找 每 个 单元 ， 而 不 像 表 中 不 允许 出 
现 重复 的 情况 时 那样 是 平均 查找 表 的 一 半 。 这 些 带 重复 的 词典 操作 的 细节 就 留 作 本 节 习 题 了 。 

总 之 ,通过 允许 重复 ,可 以 让 插入 操作 变 得 更 快 ， 时 间 是 O0) 而 不 是 O(n) 。 不 过 ,成 功 的 
删除 操作 需要 对 整个 表 进 行 查找 ， 而 不 是 平均 查找 一 半 列 表 。 而 且 对 于 查找 和 删除 ， 必 须要 处 
理 比 不 允许 重复 时 更 长 的 表 ， 虽 然 长 多 少 取决 于 搬入 词典 中 已 存在 元 素 的 频率 有 多 高 。 

要 选择 哪 种 方法 是 有 点 技巧 的 。 显 然 ， 如 果 搬 人 操作 占 主导 地 位 ， 就 应 该 允许 重复 。 在 极 
端 情况 下 ， 如 果 只 插入 而 从 不 查找 或 删除 ， 就 能 让 每 次 操作 具有 O() ( 而 不 是 O(n) ) 的 性 能 。” 
如 果 有 理由 确定 从 不 会 插入 词典 中 已 存在 的 元 素 ， 就 可 以 使 用 快速 插入 和 快速 删除 ， 那样 只 要 
找到 待 删除 元 素 的 一 次 出 现 就 可 以 停 下 了 。 男 一 方面 ， 如 果 有 可 能 插入 重复 的 元 素 ， 而 且 查 找 
或 删除 又 占 主导 地 位 , 那么 在 插入 x 之 前 最 好 还 是 先 检 查 一 下 它 是 否 已 经 存在 于 表 中 , 就 如 图 6-5 
所 示 的 insezt 函 数 那样 。 


6.4.6 ”表示 词典 的 已 排序 表 


男 一 种 方案 是 让 表示 词典 D 的 表 中 的 元 素 一 直 按 照 递增 次 序 排 好 序 。 然 后 ， 如 果 和 希望 查找 
元 素 x， 只 要 行进 到 x 可 能 出 现 的 位 置 就 行 了 , 平均 而 言 ， 也 就 是 表 的 中 间 位 置 。 如 果 遇 到 大 于 x 
的 元 素 , 就 说 明 在 后 面 的 部 分 没 希 望 找到 x 了 ,因此 就 不 用 沿 着 表 行 进 以 继续 进行 失败 的 查找 了 。 
这 样 做 可 以 节省 为 2 的 因数 (开销 变 为 一 半 )， 不 过 确切 的 因数 是 有 些 模糊 的 ， 因 为 在 表 中 每 遇 
到 一 个 元 素 就 必须 询问 按照 排序 次 序 x* 是 否 在 其 之 后 。 不 过 , 在 进行 插入 和 删除 操作 时 ,在 不 成 
功 的 查找 上 也 能 节约 同样 的 开销 。 

用 于 已 排序 表 的 查找 函数 如 图 6-6 所 示 。 把 图 6-4 和 图 6-$ 所 示 函 数 修改 为 处 理 已 排序 表 的 版 
本 的 工作 就 留 作 本 节 习 题 了 。 













































































BOOLEAN lookup(int x, LIST L) 
{ 
if (L == NULL) 
return FALSE; 
else if (x > L->element) 
return lookup(x, L->next); 
else if (x == L->element) 
return TRUE ; 
else /* 这 里 有 x < L->element， 


因此 x 不 可 能 在 已 排序 表 工 中 */ 
return FALSE; 








图 6-6 ”在 已 排序 表 中 查找 


6.4.7 各 种 方法 的 比较 


图 6-7 中 的 表格 表明 了 对 我 们 讨论 过 的 3 种 基于 表 的 词典 表示 , 执行 3 种 词典 操作 各 自 必 须 查 
找 的 单元 数 。 设 词典 中 有 7 个 元 素 ， 如果 不 允许 重复 , 这 也 就 是 表示 词典 的 表 的 长 度 。 在 允许 重 














QD 如 果 从 来 都 不 管 词典 中 有 什么 ， 还 干 嘛 费事 往 里 





自持 东西 呢 ? 
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复出 现时 ,我 们 用 m 来 表示 该 表 的 长 度 。 我 们 知道 m 三 n ,但 不 知道 mt 此 n 大 多 少 , 在 用 到 n/2 一 nn 
这 样 的 表示 方式 时 ， 意 思 是 当 查 找 成 功 时 ,平均 查找 了 n/2 个 单 元， 而 在 不 成 功 时 ,平均 查找 
了 n 个 单元 。 而 n/2 一 m 这 样 的 项 则 表示 ， 在 一 次 成 功 的 查找 中 ， 我 们 在 看 到 要 查找 的 元 素 之 
前 , 平均 会 看 到 词典 中 /2 个 元 素 ", 但 在 失败 的 查找 中 ， 就 必须 走 完整 个 长 度 为 m 的 表 ， 直 到 
到 达 其 末端 。 














图 6-7 3 种 用 链表 表示 词典 的 方法 所 查找 的 单元 数 





请 注意 ， 除 了 有 重复 情况 下 的 插入 操作 外 ， 这 些 运行 时 间 都 要 比 数据 结构 为 二 又 查找 树 时 
词典 操作 的 平均 运行 时 间 长 。 正 如 我 们 在 5.8 节 中 所 见 ， 在 使 用 二 又 查找 树 时 ， 词 典 操 作 平 均 所 
花 时 间 为 O(logn) 。 








明智 的 测试 次 序 

请 注意 图 6-6 的 程序 中 3 项 测试 的 次 序 。 首 先 要 测试 L 不 为 NULL。 我 们 没有 其 他 的 选择 ， 
为 如 果 工 为 NULL， 则 其 余 两 项 测试 会 导致 错误 。 设 y 是 L->element 的 值 。 那 么 除了 最 后 一 个 
单元 外 ,在 每 个 访问 过 的 单元 都 有 x>>y ,因为 如 果 有 Xx=y ,就 是 成 功 完成 了 查找 ,而 如 果 x<y， 
就 是 没 能 找到 Xx 而 终止 。 因 为 首先 要 测试 xy ， 而且 当 上 且 仅 当 它 失败 时 ,我 们 才 需 要 区 分 另 两 
种 情况 。 测 试 的 这 种 次 序 遵循 这 样 一 个 基本 原则 : 要 首先 测试 最 平常 的 情况 ， 并 因此 节约 平均 
要 执行 的 总 测试 数 。 

如 果 访 问 了 Kk 个 单元 ， 就 要 测试 k 次 L 是 否 为 NULL， 而 且 要 测试 k 次 x 是 否 大 于 y。 并 且 还 要 
测试 一 次 是 否 有 x=y， 这样 总 共 要 进行 2k+1 次 测试 。 也 就 是 说 ， 只 比 图 6-3 中 利用 未 排序 表 
的 1ookup 函 数 成 功 找 到 元 素 x 的 情况 多 一 次 测试 。 如 果 未 找到 该 元 素 ， 可 以 预期 在 图 6-6 中 使 
用 的 测试 要 比 在 图 6-3 中 使 用 的 测试 少 得 多 ， 因 为 图 6-6 中 平均 只 要 检查 一 半 单 元 后 就 会 停止 。 
此 ,虽然 不 管 使 用 已 排序 表 还 是 使 用 非 排序 表 ，, 词典 操作 的 大 O 运 行 时 间 都 是 O(n) ,但 是 如 
果 使 用 已 排序 表 的 话 ， 通 常会 有 常数 因子 上 的 轻微 优势 。 





6.4.8 ”双向 链表 


在 链表 中 ， 要 从 某 个 单元 向 表 的 开头 移动 不 是 那么 容易 的 。 而 双向 链表 是 这 样 一 种 数据 结 
构 ， 它 让 表 中 向 前 和 向 后 的 移动 都 非常 方便 。 整 数 双向 链表 中 的 单元 包含 3 个 字段 : 
typdef struct CELL *LIST; 
struct CELL { 
LIST previous; 
int element; 
LIST next,; 





(3 





事实 上 ， 因 为 可 能 存在 重复 ， 所 以 在 看 到 nn/2 个 不 同 元 素 前 ， 可 能 已 经 检查 了 多 于 n/2 个 元 素 。 
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多 出 来 的 这 个 字段 含有 指向 表 中 前 一 个 单元 的 指针 。 图 6-8 展 示 了 表示 表 工 = (4, a,,…, a,) 的 
双向 链表 数据 结构 。 


图 6-8 ”表示 表 工 = (a, a,,…, a,) 的 双向 链表 


双 癌 列表 结构 上 的 词典 操作 基本 与 单 向 链表 上 的 那些 操作 相同 。 要 了 解 双向 链表 的 优势 ， 
可 以 考虑 只 给 定 指向 元 素 a; 所 在 单元 的 指针 时 删除 该 元 条 的 操作 。 在 单 向 链表 中 ， 我 们 要 通过 
从 头 开始 查找 该 表 来 找 出 前 一 个 单元 。 而 有 了 双 癌 链表 ,就 可 以 通过 如 图 6-9 所 示 的 一 系列 指针 
操作 ， 在 0() 时间 里 完成 这 一 操作 。 














void delete(LIST p, LIST *pL) 
{ 

/* Dp 是 指向 待 删除 单元 的 指针 ， 

而 pL 是 指向 链表 的 指针 */ 





(1) if (p->next != NULL) 
(2) p->next->previous = p->previous; 
(3) if (p->previous == NULL) /x p 指向 第 一 个 单元 */ 
(4) (*pL) = p->next; 
else 
(5) p->previous->next = p->next; 
} 





图 6-9 从 双向 链表 中 删除 元 素 
图 6-9 中 所 示 的 delete (p, pL) 函数 接受 指向 待 删除 单元 的 指针 p， 以 及 指向 表 L 本 身 的 指 





针 pZL 作 为 参数 。 也 就 是 说 ，pL 是 指向 表 中 第 一 个 单元 的 指针 的 地 址 。 在 图 6-9 的 第 (1) 行 中 ,我 
们 要 检查 p 有 没有 指向 最 后 一 个 单元 。 如 有 果 没 有 的 话 ， 那 么 在 第 (2) 行 ， 我 们 会 让 接 下 来 那个 单 
元 的 反 疝 指针 指向 在 p 之 前 的 那个 单元 。 如 采 p 正 好 指向 第 一 个 单元 的 话 ， 就 让 它 等 于 NULL。 

第 (3) 行 会 测试 p 是 否 为 第 一 个 单元 。 如 果 是 ,那么 在 第 (4) 行 我 们 会 让 pL 指向 第 二 个 单元 。 
请 注意 ， 在 这 种 情况 下 ， 第 (2) 行 会 让 第 二 个 单元 的 previous 字 段 变 为 NULL。 如 果 p 不 是 指 癌 
第 一 个 单元 ， 那么 在 第 (5) 行 我 们 会 让 前 一 个 单元 的 正 向 指针 指向 p 之 后 的 那个 单元 。 这 样 一 来 ， 
由 p 指 向 的 那个 单元 就 顺利 地 与 表 分 离 了 ， 其 前 一 个 单元 和 后 一 个 单元 现在 是 互相 指向 的 。 


6.4.9 习题 
(1) 为 (a) 图 6-4 中 delete 也 数 ，(b) 图 6-5 中 ijnsert 浮 数 的 运行 时 间 建 立 递 推 关 系 。 它 们 的 解 各 是 多 


少 ? 

(2) 为 使 用 带 重 复 链表 的 词典 操作 插入 、 查 找 和 删除 编写 C 语 言 函 数 。 

(3) 为 如 图 6-6 那 样 使 用 已 排序 表 的 插入 和 删除 操作 编写 C 语 言 函数 。 

(4) 编写 C 语 言 函 数 ， 使 其 能 在 双 疝 链表 中 由 p 指 向 的 单元 之 后 的 新 单元 中 插入 元 素 x。 图 6-9 是 用 于 才 
除 的 相似 函数 ， 不 过 对 插入 操作 来 说 ， 我 们 不 需要 知道 表 头 L。 

(5) 如 果 使 用 双向 链表 数据 结构 ， 一 种 选择 是 不 通过 指向 单元 的 指针 表示 表 ， 而 通过 具有 未 使 用 
element 字 段 的 单元 来 表示 。 请 注意 , 这 一 “ 表 头 ”单元 本 身 并 非 表 的 一 部 分 。 该 “ 表 头 ”的 next 
字段 指 疝 该 表 真 正 的 第 一 个 单元 ， 而 这 第 一 个 单元 的 previous 字 段 则 指向 该 “ 表 头 ”单元 。 然 
后 可 以 在 不 知道 表 头 上 ( 正 是 我 们 在 图 6-9 中 需要 知道 的 ) 的 情况 下 删除 由 指针 p 指 向 的 单元 ， 而 
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不 是 那个 未 使 用 element 字 有 段 的 “ 表 头 ”。 编写 C 语 言 函 数 ， 使 其 利用 这 里 描述 的 格式 从 双 问 链 
表 中 删除 元 素 。 
(6) 编写 递归 函数 ， 实 现 使 用 链表 数据 结构 的 (a) retrieve(i, L) ; (b) length(L) ; (c) last(L)。 
(7) 扩展 下 列 函 数 ， 使 其 单元 可 以 接受 任意 类 型 BTYPE 的 元 素 ， 使 用 函数 eq(x,y) 测试 x 和 y 是 否 相 等 ， 
并 用 1t(x, y) 分 辨 x 是 否 在 ETYPE 类 型 元 素 的 次 序 下 先 于 y。 
(a) 图 6-3 中 的 lo0kup。 
(b) 图 6-4 中 的 delete。 
(c) 图 6-5 中 的 insert。 
(d) 使 用 带 重 复 表 的 insert、delete 和 lookup。 
(e) 使 用 已 排序 表 的 insert、delete 和 lookup。 


6.5 ” 表 基 于 数组 的 实现 


实现 表 的 男 一 种 常见 方式 是 创建 由 下 列 两 部 分 组 成 的 结构 体 。 

(1) 存放 元 素 的 数组 ; 

(2) 记录 表 中 当前 元 素数 量 的 变量 length。 
图 6-10 展 示 了 如 何 使 用 数组 A[0. .MAX-1] 表示 表 (qa,, qa,…, 4 1) 。 元 素 ao、a1、…、ani1 存 储 在 
A[0..n-1] 中 ,而 且 length=n。 








n—l 








MAX-!1 





图 6-10 ”存放 表 (a,, a,…, a ) 的 数组 A 


就 像 在 6.4 节 中 那样 ,我 们 假设 表 中 元 系 都 是 整数 ， 并 邀请 读者 将 这 些 函数 一 般 化 为 支持 任 
意 类 型 。 表 基于 数组 的 实现 所 使 用 结构 体 的 声明 如 下 


typedef struct { 
int A[MAX]; 
int length; 
} LIST; 


这 里 的 LIST 是 包含 两 个 字段 的 结构 体 ， 第 一 个 字段 是 存储 元 素 的 数组 A， 而 第 二 个 则 是 含有 表 
中 当前 元 素数 目的 整数 变量 length。MAX 是 个 用 户 定义 的 常量 , 用 于 为 存储 在 表 中 的 元 素 的 数 
目 确 定 边界 。 

与 表 的 链表 表示 相 比 ， 基 于 数组 的 表示 从 多 个 方面 讲 都 更 方便 。 不 过 ， 它 会 受到 表 不 能 长 
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过 数组 的 限制 ， 这 可 能 导致 插入 操作 失败 。 在 链表 表示 中 ， 只 要 有 可 用 的 计算 机 内 存 ， 就 可 以 
让 表 增 长 到 尽 可 能 长 。 

对 基于 数组 的 表 执 行 词典 操 作 ， 所 花 的 时 间 与 对 链表 表示 的 表 执 行 这 些 操作 所 花 的 时 间 基 
本 相同 。 要 插入 ， 先 查找 x。 如 果 没 找到 x， 就 要 检查 是 否 有 length < MA4X。 如 果 l1ength 不 小 于 
MAX， 就 有 出 错 的 情况 ， 因 为 没 法 将 新 元 素 装 入 数组 中 。 否 则 ,我 们 将 x 存储 在 A[length] 中 ， 
并 将 length 增 加 1。 要 删除 x， 还 是 先 查 找 x， 如 果 找 到 ， 就 将 数组 A 中 x 之 后 的 元 素 都 下 移 一 个 位 
置 ， 然 后 将 length 减 1。 插 入 和 删除 的 具体 孔 数 实现 留 作 本 厄 习 题 。 接 下 来 要 介绍 查找 操作 的 
细 市 。 


6.5.1 线性 查找 


图 6-11 是 实现 查找 操作 的 函数 。 因 为 数组 A 可 能 很 大 ， 所 以 选择 传递 指向 LIST 类 型 结构 体 
的 指针 pL 作为 lookup 的 形式 参数 。 在 该 函数 中 ,结构 体 的 两 个 字段 可 以 称 为 pL->A[i] 和 
pL->length。 

从 i=0 开始, 第 (1) 至 第 (3) 行 的 for 循 环 会 依次 检查 数组 的 每 个 位 置 ， 直 到 它 到 达 最 后 出 现 
的 位 置 ， 或 是 找到 x。 如 果 找 到 x， 就 返回 TRUE。 如 果 它 检查 了 表 中 的 每 个 元 素 而 没有 找到 x， 
就 会 在 第 (4) 行 返回 FALSE。 这 种 查找 方法 叫 作 线 性 查找 或 顺序 查找 。 

















BOOLEAN lookup(int x, LIST *pL) 
{ 


int 1i; 


(1) for (i = 0; i < pL->length; i++) 
(2) ee 

(3) return TRUE ; 

(4) return FALSE; 


} 








图 6-11 通过 线性 查找 进行 查找 操作 函数 


不 难 理解 ， 如 有 果 x 在 表 中 ， 那 么 在 找到 x 之 前 ,平均 要 查找 数组 A[0. .length-1] 的 一 半 。 
因此 ， 设 n 为 length 的 值 ， 那 么 执行 一 次 查找 要 花 O(n) 的 时 间 。 如 有 果 x 示 出现， 就 要 查找 完整 
个 数组 A[0. .length-1] ， 再 次 需要 O(n) 的 时 间 。 这 样 的 表现 ， 与 对 用 链表 表示 的 表 执 行 查 
找 操作 的 表现 是 一 样 的 。 








常数 因子 在 实际 应 用 中 的 重要 性 

纵 观 第 3 章 ， 我 们 一 直 在 强调 运行 时 间 的 大 0 度量 的 重要 性 ， 而 且 可 能 给 大 家 留 下 了 这 样 
的 印象 : 大 O 是 唯一 的 影响 因素 ,或 是 说 任何 O(n) 算法 在 执行 某 项 任务 时 都 和 其 他 O(n) 算法 
有 着 同样 的 表现 ,不 过 在 这 里 ,在 对 哨兵 的 讨论 中 ,以 及 其 他 几 节 中 ,我 们 都 会 细 究 隐藏 在 O(n) 
之 中 的 常数 因子 。 原 因 很 简单 。 尽 管 运行 时 间 的 大 0 度量 主导 了 常数 因子 ， 但 研究 该 主题 的 人 
都 能 很 快 地 了 解 这 一 点 。 例 如, 我们 了 解 到 只 要 n 大 到 足以 产生 影响 ,就 要 使 用 具有 O(nlogn) 
运行 时 间 的 排序 。 软 件 性 能 上 的 竞争 优势 ， 往 往 源 于 对 具有 正确 “大 DO” 运行 时 间 的 算法 中 的 
常数 因子 的 改进 ， 而 这 种 优势 通常 能 决定 软件 产品 的 成 败 。 
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6.5.2” 带 哨兵 的 查找 


通过 将 xI 临 时 插入 表 的 末尾 ， 可 以 简化 图 6-11 中 foz 循 环 的 代码 ， 并 为 该 程序 提速 。 在 表示 
端的 这 个 x 就 叫 作 哨 兵 ( sentinel )。 这 项 技术 最 先是 在 3.6 节 附注 栏 内 容 “ 更 具 防 御 性 的 程序 设计 ” 
中 提 到 的 ， 而 它 在 这 里 有 着 重要 的 应 用 。 假 设 在 表 的 末端 始终 有 一 个 额外 的 柳 ， 就 可 以 使 用 图 
6-12 中 的 程序 查找 x。 该 程序 的 运行 时 间 仍 为 O(n) , 但 比例 常数 更 小 ， 因 为 图 6-12 所 示 程 序 的 循 
环 体 和 循环 测试 所 需 的 机 融 指 令 数 ， 通 篆 小 于 图 6-11 所 示 程 序 所 需 的 。 














BOOLEAN lookup(int x, LIST *pL) 
{ 


int 工 ; 


pL->A[pL->length] = x; 

i = 0; 

while (x != pL->A[i]) 
j++; 


ODO- 
Sr oid a Nt Nd 


return (i < pL->length); 
} 





图 6-12 ”进行 带 哨兵 查找 的 函数 


第 (1) 行 将 哨兵 放置 在 刚好 越过 该 表 的 位 置 。 请 注意 ， 因 为 length 不 会 发 生 改变 ， 所 以 这 个 x 
并 非 真 正 是 表 的 一 部 分 。 第 (3) 和 第 (4) 行 的 循环 会 增加 i， 直 到 我 们 找到 x。 请 注意 ， 因 为 设置 了 
哨兵 ， 所 以 即便 表 是 空 表 ， 还 是 保证 能 找到 x。 在 找到 x 之 后 ， 第 (5) 行 会 测试 是 找到 了 表 中 真正 
出 现 的 x ( 也 就 是 ，i<length )， 还 是 找到 了 哨兵 (也 就 是 ，i= length )。 请 注意 ， 如 果 使 用 哨 
兵 ， 就 一 定 要 严格 保证 length 小 于 MA4X， 否 则 就 没有 位 置 放置 哨兵 了 。 


6.5.3 ”利用 二 又 查找 对 已 排序 表 进 行 查找 


假设 表 工 中 的 元 素 ao、al1、…、ay_! 已 经 按照 非 递 减 次 序 排 好 序 。 如 果 该 已 排序 表 存 储 在 数 
组 A[0..n-1] 中 ， 就 可 以 利用 二 又 查找 技术 ， 从 而 市 来 可 观 的 速度 提升 。 我 们 首先 必须 找到 
中 间 元 素 的 下 标 m， 也 就 是 说 m=[(n 一 1)/2] 。" 然 后 将 元 素 x 与 4[m] 相 比 较 。 如 果 它 们 相等 ， 
就 已 经 找到 x 了 。 如 果 x < 4[m] ， 就 递归 地 重复 对 子 表 A[0. .m-1] 的 查找 。 如 果 x> A[m] ， 就 
递归 地 重复 对 子 表 A [m+1 . .n-1] 的 查找 。 无 论 何 时 尝试 查找 空 表 ， 都 会 报错 。 图 6-13 展 示 了 

冰 数 binsearch 的 代码 要 将 x 放置 在 如 图 6-14 所 示 的 已 排序 数组 4 中 。 该 函数 使 用 变量 1ow 
和 high 表 示 x 可 能 出 现 的 区 域 的 下 界 和 上 界 。 如 果 较 低 的 区 域 超过 了 较 上 的 区 域 ， 那 么 就 没 找 
到 x， 此 时 函数 就 会 终止 并 返回 FALSE。 

否则，binsearch 会 通过 mid =|[ (low+ high) /2J 计算 该 区 域 的 中 点 。 人 然后 该 函数 会 检查 区 
域 正中 的 元 素 4[mid] ， 以 确定 x 是 否 在 该 位 置 。 如 果 x 不 在 该 位 置 ， 而 且 小 于 A[mid] ， 就 继续 在 
中 点 下 方 的 区 域 查找 ， 要 是 x 大 于 4[miz] ， 就 继续 在 中 点 上 方 的 区 域 查找 。 这 一 思路 概括 了 图 
6-13 所 示 的 划分 ， 其 中 1ow 是 0， 而 high 是 n 一 1。 



































Q@ Laj 表示 a 向 下 取 整 ， 就 是 a 的 整数 部 分 。 因 此 |6.51=6， 而 且 L6]=6 。 而 [a| 表 示 4 向 上 取 整 ， 是 大 于 等 于 a 的 
最 小 整数 。 例 如 [6.5]=7 ,而 [6]=6。 
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A 
0 
如 果 x<4 [| (x-1)/2]|， 
查找 这 里 
[1)2| 
如 果 x<4||(-D2||， 
查找 这 里 
17 一 | 


图 6-13 ”二 又 查找 将 区 域 一 分 为 二 








利用 归纳 断言 “如 果 x 在 数组 中 ,那么 它 一 定 出 现在 A[Iow. .high] 这 个 区 域内 ”， 就 可 以 
证 明 函 数 bijnsearch 的 正确 性 。 证 明 过 程 要 对 high -yow 的 差 进行 归纳 ， 这 和 留 作 本 节 的 习题 。 
在 每 次 迭代 中 ，binsearch 要 人 么 

(1) 在 到 达 第 (8) 行 时 找到 元 素 x， 要 人 么 

(2) 在 第 (5) 行 或 第 (7) 行 ， 对 长 度 至 多 为 待 查 找 数组 ALlow. .higph] 长 度 一 半 的 子 表 递 归 调 
用 上 自身 。 








BOOLEAN binsearch(int x, int A[], int low, int high) 


{ 
int mid; 
(1) if (low > high) 
(2) return FALSE; 
else { 


(3) mid = (low + high)/2; 

(4) if (x < A[mid]) 

(5) return binsearch(x, A, low, mid-1); 

(6) else if (x > Armid]) 

(7) return binsearch(x, A, mid+1, high); 
else /* x == A[mid] */ 

(8) return TRUE; 








图 6-14 ”使 用 二 又 查找 进行 查找 操作 的 函数 


由 长 度 为 x 的 数组 开始 ， 在 其 长 度 变 为 1 之 前 ,我 们 最 多 对 有 答 查 找 的 数组 进行 log,n 次 分 割 |。 
于 是 我 们 要 么 在 AImid] 找 到 xz， 要 么 在 对 空 表 调用 该 因数 后 仍 未 找到 x。 

想 要 在 具有 nn 个 元 素 的 数组 A 中 寻找 x， 可 以 调用 binsearch (x,A,0,n-1)。 我 们 知道 
binsearch 最 多 会 调用 自身 O(logn) 次 。 在 每 次 调用 中 ， 都 要 花费 0() 的 时 间 ， 再 加 上 递归 调 
用 的 时 间 ， 因 此 二 又 查找 的 运行 时 间 是 O(logn) 。 这 是 可 与 平均 花费 O(n) 时 间 的 线性 查找 相 媲 
美的 查找 方式 。 
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6.5.4 “习题 


(1) 编写 函数 ， 利 用 对 数组 的 线性 查找 进行 下 列 操 作 : (a) 向 表 Z 中 插入 xz; (b) 从 表 Z 中 删除 x。 

(2) 使 用 带 哨 兵 的 数组 ， 重 复习 题 (1) 的 练习 。 

(3) 使 用 已 排序 数组 ， 重 复习 题 (1) 的 练习 。 

(4) 假设 表 中 元 素 具 有 任意 类 型 ETYPE， 对 ETYPE 类 型 来 说 有 子 数 eq(x,y) 区 分 x 和 y 是 否 相 等 ， 还 有 

Wy(x,y) 函数 可 以 区 分 x 就 ETYPE 类 型 元 素 的 次 序 而 言 是 否 先 于 y， 编 写 以 下 函数 : 
(a) 图 6-11 中 的 lookup 了 邱 数 ; 

(b) 图 6-12 中 的 lookup 函 数 ; 

(c) 图 6-14 中 的 binsearch 国 数 。 

(5) **# 设 图 6-14 中 的 二 又 查找 算法 最 多 进行 钦 探 测 (也 就 是 在 第 (3) 行 求 mnia 的 值 ) 时 最 长 数组 的 长 度 
(high 一 low+]) 为 P(Kk) 。 例如 ，PQ)=1， 且 P(2)=3。 写 出 P(b 的 递 推 关 系 ， 再 求 出 自己 所 写 的 
递 推 关系 的 解 。 它 是 否 说 明 二 又 查找 进行 的 探测 次 数 为 O(logn) ? 

(6)* 对 1ow 和 high 之 差 进行 归纳 , 证 明 : 如 果 x 在 区 域 A[low. .high] 中 ,那么 图 6-14 中 的 二 叉 查 找 算 
法 会 找到 x。 

(7) 假设 数组 中 可 以 出 现 重复 的 元 素 , 使 得 插入 操作 可 以 在 0Q) 时 间 内 完成 。 为 这 种 数据 结构 编写 括 
入 、 删 除 和 查找 男 数 。 

(8) 使 用 近代 ， 重 新 编写 二 叉 查 找 程序 。 

(9) ** 为 对 n 个 元 素 的 数组 进行 二 又 查 找 的 运行 时 间 建 立 递 推 关 系 ， 并 求解 。 提 示 : 为 了 简化 问题 ， 
可 以 取 7(n) 作 为 对 具有 n 个 或 更 少 元 素 ( 而 不 是 像 我 们 常用 的 方法 那样 刚好 有 n 个 元 素 ) 的 数组 进 
行 二 叉 查 找 的 运行 时 间 上 界 。 

(10) 在 三 分 查找 中 ， 给 定 从 1ow 到 jiej 的 区 域 ， 先 计算 该 区 域 中 大 约 1/3 处 的 位 置 

first=| (2xlow+ high)/3| 
并 将 其 与 4[seconq] 相 比较 。 如 果 x > 4 和 first] ， 就 计算 近似 2/3 处 的 位 置 
second =| (low + 2x high) /3| 
并 将 x 与 4[second] 进 行 比较 。 因 此 我 们 将 x 隔离 在 这 3 个 区 域 的 其 中 一 个 里 , 每 个 区 域 都 不 大 于 low 
到 high 形 成 区 域 的 三 分 之 一 。 编 写 函 数 执行 三 分 查找 。 
(11) ** 用 三 分 查找 重复 习题 (5)。 也 就 是 说 ,要 找 出 三 分 查找 时 最 多 需要 次 探测 的 最 大 数组 的 递 推 关 
系 并 为 其 求解 。 二 又 查找 和 三 分 查找 哪 种 所 需 的 探测 次 数 多 ? 也 就 是 说 ， 对 于 给 定 的 E， 二 又 查 
找 和 三 分 查找 哪 种 能 处 理 更 大 的 数组 ? 


























6.6 枝 


栈 是 基于 表 数 据 模 型 的 抽象 数据 类 型 ， 栈 中 的 所 有 操作 都 是 在 表 的 一 端 执 行 的 ， 而 这 一 端 
就 叫 作 栈 的 栈 顶 。 术 语 “LIFO 表 ”( 后 人 先 出 表 ) 指 的 就 是 栈 。 

栈 的 抽象 模型 与 表 的 抽象 模型 如 出 一 辐 , 也 就 是 一 列 某 一 类 型 的 元 素 a1、a,、…、an。 将 栈 与 
一 般 表 区 分 开 来 的 就 是 栈 可 以 接受 的 一 些 特殊 操 作 。 我 们 将 在 后 面 的 内 容 中 介绍 更 加 齐全 的 操 
作 , 不 过 现在 ,我 们 注意 到 最 精髓 的 栈 操作 就 是 push ( 压 入 ) 和 pop (弹出 )， 其 中 push(x) 是 将 
元 素 x 放 在 栈 顶 , pop 则 是 从 栈 中 移 除 最 顶端 的 元 素 。 如 果 将 栈 顶 写 在 右 端 , 那么 对 表 ( a1, az, …， 
qa) 应 用 push(x) 操 作 , 就 得 到 表 ( aa ,ax) 而 弹出 表 (a as,…, a ) 得 到 的 是 表 ( ai, aq,…， 
qn-1 )。 弹 出 空 表 e 是 不 可 能 的 ， 而 且 会 出 错 。 
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+ 示例 6.9 

很 多 编译 融 首 先 会 把 出 现在 程序 中 的 中 绥 表 达 式 转换 成 等 价 的 后 缀 表达 式 。 人 例如， 表达 式 
(3+4)x2 的 后 级 形式 就 是 34+2x 。 栈 可 以 用 来 为 后 缀 表达 式 求 值 。 由 空 栈 开始 , 我 们 从 左 至 右 
扫描 需要 求 值 的 后 缀 表达 式 。 每 当 遇 到 一 个 参数 ， 就 将 其 压 和 人 栈 中 。 而 在 遇 到 运算 符 时 ， 就 弹 
出 栈 两 次 , 并 记 下 弹出 的 操作 数 。 然 后 对 弹出 的 两 个 值 ( 其 中 第 二 个 值 是 运算 符 左 边 的 操作 数 ) 
应 用 该 运算 符 ， 然 后 将 结果 压 人 该 栈 。 图 6-1$ 展 示 了 处 理 后 缀 表达 式 34+2x 每 一 步 操作 之 后 栈 
的 情况 。 在 完成 处 理 后 ， 求 值 的 结果 14 留 在 该 栈 中 。 





初始 化 € 
3 3 push 3 
4 3,4 push 4 
十 € pop4 ;pop3 
计算 7=3+4 
7 push 7 
2 7.2 push 2 
x € pop2 ;pop7 
计算 14=7x2 
14 push 14 


图 6-15 用 栈 求 后 缀 表达 式 的 值 


6.6.1 对 栈 的 操作 


之 前 讨论 过 的 两 种 抽象 数据 类 型 一 一 词典 和 优先 级 队列 ,都 拥有 一 组 明确 与 之 关联 的 操作 。 
栈 其 实 是 一 些 相似 的 ADT， 它 们 有 着 相同 的 底层 模型 ， 但 各 自 有 着 所 允许 操作 集 不 同 的 变种 。 
在 本 市 中 ,我们 要 讨论 栈 的 通用 操作 ， 并 展示 两 种 可 用 来 实现 栈 的 数据 结构 ， 一 种 是 基于 链表 
的 ， 另 一 种 是 基于 数组 的 。 

正如 之 前 提 到 的 , 在 任意 一 组 栈 操 作 中 都 可 以 看 到 push 和 pop。 为 栈 ADT 选 择 的 操作 还 有 个 
共性 : 它们 都 可 以 在 0Q) 时 间 内 实现 ， 而 与 栈 中 的 元 素数 量 无 关 。 大 家 可 以 自行 验证 一 下 ， 对 
于 我 们 提 到 的 两 种 数据 结构 ， 所 有 操作 都 只 需要 常数 时 间 。 

除了 push 和 pop 外 ， 通 常 还 需要 clear 操 作 将 栈 初 始 化 为 空 栈 。 在 示例 6.9 中 ， 默 认 假 设 栈 一 
开始 为 空 ， 而 没有 解释 它 为 什么 是 这 样 。 还 有 一 种 操作 ， 就 是 确定 栈 当前 是 否 为 空 的 测试 。 

最 后 要 考虑 的 操作 是 确定 栈 是 否 “ 已 满 ” 的 测试 。 现 在 在 栈 的 抽象 模型 中 ， 没 有 关于 满 栈 
的 概念 ， 因 为 原则 上 讲 ， 栈 是 可 以 随意 变 长 的 表 。 不 过 ,在 栈 的 任何 一 种 实现 中 ， 都 会 有 某 个 
无 法 超越 的 长 度 。 最 常见 的 例子 就 是 在 用 数组 表示 表 或 栈 时 。 正 如 在 6.5 节 中 看 到 的 ， 必 须 假 设 
表 的 长 度 不 会 超过 常量 MAX， 否 则 insert 函 数 的 实现 就 没 法 正常 工作 了 。 

我 们 在 自己 的 栈 的 实现 中 将 要 使 用 的 这 一 操作 的 正式 定义 如 下 。 设 S 是 ETYPE 类 型 的 栈 而 且 
Xx 是 ETYPE 类 型 的 元 素 。 

(1) clear(S) 。 将 栈 $ 清 空 。 

(2) isEmpty(S) 。 如 果 $ 为 空 ， 返 回 TRUE， 和 否则 返回 FALSE。 
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(3) isFul1(S) 。 如 果 S 已 满 ， 返回 TRUE， 耕 则 返回 FALSE。 

(4) pop(S,x) 。 如 果 5 为 空 ， 返回 FALSE; 否则 ， 将 x 置 为 栈 S 栈 顶 元 素 的 值 ， 并 将 该 元 素 从 
栈 $ 中 删除 ， 然 后 返回 TRUE。 

(5) push(x,S) 。 如 果 S 已 满 ， 返回 FALSE; 和 否则， 将 元 素 x* 添 加 到 8 的 栈 顶 ， 并 返回 TRUE。 

Pop 的 一 个 常见 变种 会 假设 $ 非 空 。 它 只 接受 $ 作 为 参数 , 并 返回 被 弹出 的 元 素 x。 而 pozp 的 另 
一 个 版 本 则 根本 不 返回 值 ， 它 只 是 将 栈 顶 处 的 元 素 删 除 。 同 样 ， 我 们 可 以 在 编写 push 时 假设 S 
“未 满 ”"。 在 这 种 情况 下 ，push 不 返回 任何 值 。 


6.6.2” 栈 的 数组 实现 


用 于 表 的 这 种 实现 也 能 用 于 栈 。 我 们 将 首先 讨论 基于 数组 的 实现 ， 接 着 讨论 链表 表示 。 在 
两 种 情况 下 ， 我 们 都 将 元 素 类 型 定 为 int。 更 一 般 化 的 工作 还 是 留 作 本 节 习 题 。 








7 一 | 








MAX-1 





图 6-16 ”表示 栈 的 数组 


基于 数组 的 整数 栈 的 声明 如 下 。 
typedef struct { 

int A[MAX]; 

int top; 
} STACK; 


在 基于 数组 的 实现 中 , 栈 既 可 以 向 上 增长 《从 较 低 区 域 向 较 高 区 域 ), 也 可 以 向 下 增长 ( 从 较 高 
区 域 向 较 低 区 域 )。 在 这 里 我 们 选择 让 栈 向 上 增长 ", 也 就 是 说 , 栈 中 最 老 的 元 素 ao 在 位 置 0, 第 
二 老 的 元 素 @ 在 位 置 1， 而 最 新 插入 的 元 素 w-i 在 位 置 x-1。 

数组 结构 体 中 的 top 字 上 段 指示 了 栈 项 的 位 置 。 因 此 ， 在 图 6-16 中 ，top 的 值 为 n-1。 空 栈 是 
通过 top=-1 来 表示 的 。 在 这 种 情况 下 ， 数 组 A 的 内 容 是 无 关 紧 要 的 ， 栈 中 没有 任何 元 素 。 

6.6.1 节 中 定义 的 5 种 栈 操作 对 应 的 程序 如 图 6-17 所 示 。 我 们 通过 引用 传递 栈 , 来 避免 复制 作 
为 函数 参数 的 大 数组 。 





QD 因此 “ 栈 顶 ”在 图 中 是 出 现在 底部 的 ， 这 是 种 不 凑巧 但 相当 标准 的 约定 。 
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void clear(STACK *pS) 
{ 
PS->top = -1,; 


BOOLEAN isEmpty(STACK *pS) 


{ 
return (pS->top < 0); 
} 
BOOLEAN isFull (STACK *pS) 
{ 
return (PS->top >= MAX-1); 
} 
BOOLEAN pop(STACK *pS, int *px) 
{ 
if (isEmpty(pS) ) 
return FALSE ; 
else 苹 
(*px) = PS->A[(PS->top)--] ; 
return TRUE ; 
} 
了 


BOOLEAN push(int x, STACK *pS) 
{ 


if (isFull (pS8)) 
return FALSE ; 

else 攻 
pS->A[++(pS->top)] = xXx; 
return TRUE ; 





图 6-17 ”用 来 实现 数组 上 的 栈 操作 的 函数 


6.6.3 ” 栈 的 链表 实现 


与 表 一 样 ， 可 以 用 链表 数据 结构 表示 栈 。 不 过 ， 如 果 栈 顶 是 表 的 前 端 就 会 很 方便 。 这 样 的 
话 , 可 以 在 表 的 表 头 压 入 和 弹出 , 都 只 用 花 OQ) 的 时 间 。 如 果 必 须 找 到 表 的 端点 再 压 人 和 弹出 ， 
对 长 度 为 "的 栈 执 行 这 些 操 作 就 要 花 O(n) 的 时 间 。 而 这 样 一 来 ， 栈 $= (a1,as,…,an) 必须 用 链 








表 “ 倒 着 ”表示 为 : 


在 定义 表单 元 时 使 用 过 的 类 型 定义 宏 也 可 以 用 于 栈 。 宏 
DefCell(int, CELL, STACK):; 
定义 了 整数 栈 ， 并 扩展 为 
typdef struct CELL *STACK; 
struct CELL { 
int element,; 


STACK next; 
上 





对 这 种 表示 而 言 ，5 种 操作 可 以 用 图 6-18 中 的 函数 实现 。 我 们 假设 malloc 从 不 会 用 尽 空 间 ， 这 
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意味 着 isFul! 操 作 总 是 会 返回 FALSE， 而 且 push 操 作 从 不 会 失败 。 


void clear (STACK *pS) 
{ 





(*pS) = NULL; 
} 


BOOLEAN isEmpty(STACK *pS) 


return ((*pS) == NULL) ; 


} 
BOOLEAN isFull(STACK *pS) 
{ 
return FALSE ; 
} 


BOOLEAN pop(STACK *pS, int *px) 


if ((*pS) == NULL) 
return FALSE; 


else { 
(*px) = (*pS)->element; 
(*pS) = (*pS)->next; 


return TRUE ; 


} 


BOOLEAN push(int x, STACK *pS) 


{ 
STACK newCell; 


newCell = (STACK) malloc(sizeof (struct CELL) ) ; 
newCell->element = xXx; 

newCell->next = (*pS); 

(*pS) = newCell; 

return TRUE; 





图 6-18 ”链表 实现 的 栈 所 使 用 的 函数 
对 用 链表 实现 的 栈 执行 push 和 pop 的 效果 如 图 6-19 所 示 。 


加 


(外) 表 L 








6 x a b c 


(b) 执行 push(x，Z) 之 后 


| 
(0) 对 (@) 中 的 表 执 行 pop(L， 台 ) 之 后 
图 6-19 ”对 用 链表 实现 的 栈 执 行 压 人 和 弹出 操作 


6.7 使 用 栈 实 现 函 数 调用 251 





6.6.4 习题 


(1) 由 空 栈 开始 ， 在 执行 操作 序列 push(a)、push(b)、pop、push(c)、push(d)、pop、push(e)、pop、pop 
之 后 ， 栈 中 还 剩 什么 。 

(2) 只 使 用 本 市 讨 论 的 5 种 栈 操作 操作 栈 ,编写 C 语 言 程序 , 按照 图 6-9 所 示 的 算法 ,为 使 用 整数 操作 数 
及 4 种 常用 算术 运算 符 的 后 绥 表 达 式 求 值 。 恰 当地 定义 数据 类 型 SrTAcK， 并 先后 在 程序 中 用 上 网 
6-17 和 图 6-18 中 的 函数 ， 以 此 证 实 大 家 编写 的 程序 既 可 以 使 用 数组 实现 ， 也 可 以 使 用 链表 实现 。 

(3)* 怎样 用 栈 为 前 绥 表 达 式 求 值 ? 

(4) 计算 图 6-17 和 图 6-18 中 各 函数 的 运行 时 间 。 它 们 是 否 全 为 O0) ? 

(5) 栈 ADT 有 时 会 使 用 top 操 作 ，top(5) 会 返回 栈 S (一 定 要 假设 该 栈 非 空 ) 的 栈 顶 元 素 。 编 写 可 与 本 
节 中 定义 栈 的 
(a) 数组 数据 结构 
(b) 链表 数据 结构 
一 起 使 用 的 top 函 数 。 这 两 个 top 的 实现 花 的 时 间 是 否 都 是 0(1) ? 

(6) 模拟 栈 ， 计 算 以 下 后 级 表 达 式 的 值 : 

(a) ab + cd xt+ex 
(b) apcae 二 十 十 十 
(c) ab+c+d+et 

(7)* 假设 从 空 栈 开始 ， 执 行 一 些 压 入 和 弹出 操作 。 如 果 在 这 些 操作 之 后 的 栈 为 (a, a,,…,a,) ， 栈 顶 

在 右 侧 ， 证明: 对 i=1, 2,…, n 一 1, 4 是 在 a,, 压 人 之 前 被 压 人 栈 的 。 











6.7 ”使 用 栈 实现 函数 调用 


栈 的 一 项 重要 应 用 常 不 为 人 所 见 : 栈 可 以 用 来 为 程序 中 多 个 函数 的 变量 分 配 计算 机 内 存 
空间 。 我 们 要 讨论 的 是 用 于 C 语 言 的 机 制 ， 不 过 相似 的 机 制 也 几乎 用 在 其 他 每 种 程序 设计 语 
言 中 。 

要 理解 问题 是 什么 ， 可 考虑 2.7 市 中 简单 的 递归 阶乘 函数 fact， 该 函数 图 6-20 所 示 。fact 
国 数 有 一 个 参数 n 以 及 一 个 返回 值 。 随 着 fact 递 归 地 调用 自身 ， 不 同 的 调用 将 会 同时 处 于 活动 
状态 。 这 些 调 用 有 着 值 各 不 相同 的 参数 n， 而 且 会 产生 不 同 的 返回 值 。 那 这 些 有 着 相同 名 称 的 不 
同 对 象 要 存放 在 哪里 呢 ? 

















int fact(int n) 


{ 
(1) if (n <= 1) 
(2) return 1; /x 依据 */ 
else 
(3) return n*fact(n-1); /x* 归纳 */ 
} 





图 6-20 ”计算 n! 的 递归 函数 
要 回答 这 一 问题 ， 必 须 先 对 与 程序 设计 语言 相关 联 的 运行 时 组 织 ( run-time organization ) 
有 所 了 解 。 运 行 时 组 织 是 一 种 规划 ， 它 将 计算 机 内 存 细 分 为 不 同 区 域 ， 以 存放 程序 所 使 用 的 不 
同 数据 项 。 当 程序 运行 的 时 候 ， 函 数 的 每 次 执行 称 作 一 次 活动 (activation )。 与 每 次 活动 相关 联 
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的 数据 对 象 都 存储 在 计算 机 内 存 中 称 为 该 活动 的 活动 记录 (activation record ) 的 区 块 里 。 这 些 
数据 对 象 包括 参数 、 返 回 值 、 返 回 地 址 和 该 函数 的 局 部 变量 。 

图 6-21 展 示 了 有 代表 性 的 运行 时 内 存 细 分 情况 。 第 一 个 区 域 含 有 执行 中 的 程序 的 对 象 代码 。 
而 接 下 来 的 区 域 包含 了 用 于 该 程序 的 静态 数据 ， 比 如 某 些 常 量 以 及 程序 使 用 的 外 部 变量 的 值 。 
第 三 个 区 域 是 运行 时 栈 , 它 是 问 着 内 存 中 的 高 位 地 址 癌 下 增长 的 。 在 最 高 编号 内 存 区 域 的 是 堆 ， 
该 区 域 是 为 用 malloc 动 态 分 配 的 对 象 预 留 的 。” 

















图 6-21 ”上 典型 的 运行 时 内 存 组 织 


运行 时 栈 中 存放 着 当前 处 于 活跃 状态 的 所 有 活动 的 记录 。 栈 是 种 合适 的 结构 ， 因 为 在 调用 
函数 时 ， 可 以 把 活动 记录 压 入 栈 中 。 任 何 时 候 ， 当 前 正在 执行 的 活动 41 的 记录 会 在 栈 顶 位 置 。 
而 正好 位 于 栈 顶 之 下 的 是 调用 41 的 4; 的 活动 记录 。 在 4; 的 活动 记录 之 下 的 ， 是 调用 4; 的 活动 的 
记录 ,以 此 类 推 。 当 函数 返回 时 ,就 弹出 栈 顶 的 活动 记录 ,露出 调用 该 活动 的 函数 的 活动 记录 。 
这 正 是 要 做 的 事情 ， 因 为 当 函 数 返 回 时 ， 控 制 权 会 传递 给 调用 函数 。 














+ 示例 6.10 

考虑 一 下 如 图 6-22 所 示 的 程序 骨架 。 该 程序 是 非 递 归 的 ， 而 且 任 一 也 数 中 一 直 只 有 一 个 活 
动 。 当 主 函 数 开 始 执行 时 ， 它 包含 着 变量 x、y 和 z 对 应 空间 的 活动 记录 会 被 压 人 栈 中 。 当 函数 P 
在 标记 为 Here 的 位 置 被 调用 时 ， 它 的 活动 记录 (含有 变量 pl 和 p2 对 应 的 空间 ) 会 被 压 人 栈 中 。 
2 当 P 调 用 o 时 ，@ 的 活动 记录 被 压 人 栈 中 。 至 此 ， 栈 的 情况 如 图 6-23 所 示 。 

当 Q 执 行 完 毕 时 ， 它 的 活动 记录 就 会 从 栈 中 弹出 。 此 时 ，P 也 完成 了 ， 所 以 它 的 活动 记录 也 
会 被 弹出 。 最 后 ，main 也 完成 执行 ， 并 将 它 的 活动 记录 弹出 栈 。 现 在 栈 为 空 栈 ， 而 程序 也 执行 


完毕 了 。 











(D 不 要 把 这 里 用 到 的 术语 “ 堆 ” 与 5.9 节 中 讨论 的 堆 数 据 结 构 弄 混 了 。 
Q@ 请 注意 ，P 的 活动 记录 有 两 个 数据 对 象 ， 因 此 它 的 “类 型 ”与 主 程序 活动 记录 的 “类 型 ”是 不 同 的 。 不 过 ,我们 
可 以 将 某 程序 所 有 记录 类 型 的 形式 视 作 某 一 记录 类 型 的 不 同 变种 ， 因 此 维护 了 栈 的 元 素 具有 相同 类 型 的 观点 。 
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void P() ; 
void Q(); 


main() { 
int xX YY Z; 


P(); /* 这 里 */ 
} 


void PO; 
int pi, p2; 


QO; 
} 


void QO) 


int ql q2, 9q3; 








图 6-23” 当 函数 Q 正 在 执行 时 的 运行 时 栈 


+ 示例 6.11 
考虑 图 6-20 所 示 的 递归 函数 fact。 同 一 时 间 可 能 有 很 多 fact 的 活动 处 于 活跃 状态 ,不 过 
每 一 个 活动 都 有 着 相同 形式 的 活动 记录 ， 即 


n 
fact 


其 中 首先 装 入 的 是 对 应 参数 n 的 单词 ， 接 着 是 对 应 返回 值 的 单词 ， 这 里 表示 为 fact。 返 回 值 直 
到 活动 的 最 后 一 步 ， 在 返回 之 前 才 会 被 装 入 。 
假设 调用 fact (4) ， 这 样 就 创建 了 具有 如 下 形式 的 活动 记录 。 


n 4 
fact 一 
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随 着 fact (4) 调 用 fact (3) ， 接 着 要 将 表示 该 活动 的 活动 记录 压 人 运行 时 栈 ， 现 在 该 栈 就 
成 了 : 








请 注意 ， 这 里 有 两 个 名 为 n 和 两 个 名 为 fact 的 位 置 。 不 过 这 样 并 不 冲突 ， 因 为 它们 属于 不 同 的 
活动 ， 而 且 一 次 只 有 一 个 活动 记录 可 以 位 于 栈 顶 : 属于 当前 正在 执行 的 活动 的 活动 记录 。 

fact (3 ) 接着 会 调用 fact (2), 而 fact(2) 又 会 调用 fact (1) 。 至 此 , 运行 时 栈 如 图 6-24 
所 示 。fact (1) 现 在 不 再 进行 递归 调用 ,而 是 赋值 fact=1。 因 此 , 值 1 被 放 入 顶部 活动 记录 为 fact 
预 留 的 槽 中。 而 其 他 标记 为 fact 的 权 未 受 影响 ， 如 图 6-25 所 示 。 











图 6-2$ fact (1) 计算 其 值 之 后 


接着 ，fact (1) 返回， 将 对 应 fact (2) 的 活动 记录 暴露 在 外 ， 并 在 fact (1) 被 调用 的 位 
置 将 控制 权 返 回 给 fact (2) 。 来 自 fact(1) 的 返回 值 1 会 乘 上 fact (2) 对 应 活动 记录 中 m 的 值 ， 
而 该 乘积 就 被 放置 到 该 活动 记录 里 fact 对 应 的 柳 中 ,正如 图 6-20 中 第 (3) 行 所 需要 的 。 得 到 的 栈 
如 图 6-26 所 示 。 
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4 
3 
n 2 
fact 2 





图 6-26 ”fact (2) 计 算 其 值 之 后 
同样 ，fact (2) 接着 将 控制 权 返 回 给 Eact (3) ， 而 且 对 应 fact (2) 的 活动 记录 会 被 弹出 
栈 。 而 返回 值 2 会 乘 上 fact (3 ) 对 应 的 n， 得 出 返回 值 6。 然 后 ，fact(3) 返 回 ， 并 将 其 返回 值 
乘 以 fact (4) 中 的 mn， 得 到 返回 值 24。 运 行 时 栈 现 在 成 了 : 


n 4 
fact 24 


至 此 , fact (4) 返 回 到 某 假设 的 调用 也 数 ,其 活动 记录 (未 表示 出 来 ) 在 栈 中 正 位 于 fact (4) 
之 下 。 不 过 ， 它 会 接收 返回 值 24 作 为 fact (4) 的 值 ， 并 继续 自己 的 执行 。 





习题 
(1) 考虑 一 下 图 6-27 中 的 C 语 言 程序 。main 函 数 的 活动 记录 含有 对 应 整数 的 槽 。 而 sum 的 活动 记录 中 
的 重要 数据 包括 : 
(a) 参数 i; 
(b) 返回 值 ; 


(c) 未 命名 的 临时 区 域 ， 我 们 称 为 kemp ， 用 来 存储 sum (i+1) 的 值 。sum (i+1) 是 在 第 (6) 行 中 计 
算 的 ， 而 且 之 后 会 与 4 中 相 加 以 形成 返回 值 。 
假设 4 目的 值 为 10i， 给 出 紧邻 每 次 对 sum 的 调用 之 前 和 之 后 活动 记录 栈 的 情况 。 也 就 是 说 ， 给 
出 紧 接 在 压 人 sum 的 活动 记录 之 后 , 且 刚 要 从 栈 中 弹出 一 个 活动 记录 之 前 栈 的 情况 。 大 家 无 需 
每 次 都 给 出 底层 ( 对 应 main 函 数 的 ) 活动 记录 的 内 容 。 





#define MAX 4 

int ALMAX] ; 

int sum(int i); 

main() 

{ 

int 1i; 

(1) for (i = 0; i < MAX; i++) 
(2) scanf ("%d", &AL[il]); 
(3) printf("%d\n", sum(0)); 

} 

int sum(int i) 

{ 
(4) if (i >= MAX) 
(5) return 0; 

else 

(6) return A[i] + sum(i+1); 








图 6-27 ”习题 (1) 的 程序 
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(2) * 图 6-28 所 示 的 delete 也 数 会 删除 链表 中 第 一 次 出 现 的 整数 x， 链 表 由 定义 如 下 的 普通 单元 组 成 : 
DefCell(int, CELL, LIST); 
delete 的 活动 记录 由 参数 x 和 pL 组 成 。 不 过 ， 因 为 pL 是 指向 表 的 指针 ， 所 以 活动 记录 中 第 二 个 
参数 的 值 不 是 指向 表 中 第 一 个 单元 的 指针 , 而 是 男 一 个 指针 , 它 指向 的 是 指向 第 一 个 单元 的 指针 。 
通常 ,活动 记录 会 存放 指向 某 个 单元 next 字 段 的 指针 。 在 从 其 他 菏 个 函数 调用 delete (3,&L) ， 
而 且 L 是 指向 链表 (1，2，3，4) 第 一 个 单元 的 指针 时 ， 给 出 栈 的 序列 。 








void delete(int x, LIST *pL) 
{ 
if ((*pL) != NULL) 
if (x == (*pL)->element) 
(*pL) = (*pL)->next; 
else 
delete(x, &((*pL)->next)); 
} 








图 6-28 ”习题 (2) 的 程序 


6.8 队列 


男 一 种 基于 表 数 据 模型 的 抽象 数据 类 型 是 队列 。 这 是 一 种 形式 受 限 的 表 ， 它 的 元 素 只 能 从 
后 端 插入 ， 并 从 前 端 删除 。 术 语 “FIFO 表 ”( 先 人 先 出 表 ) 就 是 指 队列 。 

对 队列 的 直观 想法 就 是 出 纳 员 窗 口 前 的 队伍 。 人 们 从 尾部 进入 队伍 ， 并 在 到 达 队 首 时 接受 
服务 。 与 栈 不 同 的 是 ， 队 列 是 很 公平 的 ， 人 们 是 按照 进入 队伍 的 顺序 接受 服务 的 。 因 此 ， 等 待 
得 最 久 的 那个 人 就 是 下 一 个 接受 服务 的 人 。 


6.8.1 ”对 队列 的 操作 


队列 使 用 的 抽象 模型 与 表 (或 栈 ) 使 用 的 抽象 模型 是 相同 的 ， 不 过 对 队列 执行 的 操作 却 是 
特殊 的 。 队 列 具 有 两 种 特有 的 操作 ， 入 队 (enqueue ) 和 出 队 〈dequeue )。enqueue(x) 会 将 x 添加 
到 队列 后 端 ， 而 dequeue 则 会 从 队列 前 端 删 除 元 素 。 就 像 栈 那样 ， 我 们 还 会 需要 将 其 他 一 些 实用 
操作 应 用 到 队列 上 。 

设 O 是 元 素 类 型 名 为 ETYPE 的 队列 ， 并 设 x 是 ETYPE 类 型 的 元 素 。 我 们 要 考虑 以 下 对 队列 的 
操作 。 

(1) clear(O)。 将 队列 CO 置 空 。 

(2) dequeue(Q，x)。 如 果 O 为 空 ， 返回 FALSE; 否则 ,将 x 置 为 0 前 端 元 素 的 值 ， 并 将 该 元 素 
从 QO 中 删除 ， 然 后 返回 TRUE。 

(3) enqueue(x, Q)。 如 有 果 O 已 满 , 返回 FALSE; 否则 , 将 元 素 x 添 加 到 0 的 后 端 , 并 返回 TRUE。 

(4) isEmpty(Q)。 奇 0 为 空 则 返回 TRUE， 否 则 返回 FALSE。 

(5) isFul(Q)。 奉 QO 已 满 则 返回 TRUE， 人 否则 返回 FALSE。 

就 像 栈 那样 ， 我 们 可 以 给 出 更 具 “ 信 任 度 ”的 enqueue 和 和 dequeue， 其 中 enqueue 不 会 检查 队 
列 是 否 已 满 ， 而 dequeue 不 会 检查 队列 是 否 为 空 。enqueue 不 再 返回 值 ， 而 dequeue 则 只 接受 O 作 
为 参数 ， 并 返回 被 请 出 队列 的 值 。 
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6.8.2 ”队列 的 链表 实现 

用 于 队列 的 一 种 实用 数据 结构 是 基于 链表 的 。 首 先是 由 宏 给 出 的 单元 定义 

DefCell(int, CELL, LIST); 

一 如 本 前 前 面 的 内 容 ， 假 设 队 列 中 的 元 素 剖 是 整数 ， 并 请 读者 自己 将 我 们 的 函数 一 般 化 为 
处 理 任 意 元 素 类 型 。 

队列 的 元 系 将 存储 到 链表 的 单元 中 。 队 列 本 身 是 具有 两 个 指针 的 结构 , 一 个 指向 前 端 单元 ， 
也 就 是 链表 的 第 一 个 单元 ; 另 一 个 指向 后 端 单元 ， 也 就 是 链表 的 最 后 一 个 单元 。 这 就 是 说 ， 有 
如 下 定义 

typedef struct 1{ 


LIST front, rear; 
} QUEUE ; 


如 果 队 列 为 空 ，front 就 将 是 NULL， 而 rear 的 值 就 无 关 紧要 了 。 











更 多 的 抽象 数据 类 型 
可 以 将 栈 和 队列 加 到 5.9 节 中 引入 的 抽象 数据 类 型 表 中 。 我 们 在 6.6 节 中 介绍 了 栈 使 用 的 两 
种 数据 结构 ， 并 在 6.8 节 中 介绍 了 队列 使 用 的 一 种 数据 结构 。 而 6.8 节 的 习题 (3) 则 提 到 了 实现 数 
组 的 另 一 种 数据 结构 ,“ 和 循环 数组 ”。 








抽象 数据 类 型 栈 队 列 
抽象 实现 表 表 
数据 结构 1) 链表 1) 链表 
2) 数组 2) 循环 数组 





图 6-29 给 出 了 实现 本 节 所 提 队 列 操作 的 程序 。 请 注意 ， 在 使 用 链表 时 ， 就 没有 “ 满 ”队列 
的 概念 了 ， 这样 一 来 isFull 总 会 返回 FALSE。 不 过 ， 如 果 使 用 某 种 基于 数组 的 队列 实现 ， 就 可 能 
会 有 满 队 列 。 


6.8.3 ”习题 


(1) 给 出 从 空 队列 开始 ， 在 执行 操作 序列 enqueue(a)、enqueue(b)、dequeue、enqueue(c)、enqueue(d)、 
dequeue、enqueue(e)、dequeue、dequeue 之 后 镜 下 的 队列 。 

(2) 证 明 图 6-29 中 的 各 函数 都 能 在 0() 时 间 内 执行 ， 而 不 需要 考虑 队列 的 长 度 。 

(3)* 可 以 用 数组 表示 队列 ， 只 要 队列 不 会 增长 得 太 长。 为 了 让 操作 只 花 O0) 的 时 间 ， 必 须 将 数组 视 
为 循环 的 。 也 就 是 说 ， 数 组 A[0. .n-1] 要 被 视 为 A[1] 在 A[0] 之 后 、A[2] 在 A[1] 之 后 ， 以 此 类 
推 ， 直 到 A[n-1] 在 A[n-2] 之 后 , 不 过 还 有 A[0] 在 A[n-1] 之 后 。 队 列 可 以 用 表示 队列 前 端 元 素 
和 后 端 元 素 位 置 的 一 对 整数 Eront 和 rear 表 示 。 空 队列 可 以 表示 为 在 循环 的 情况 下 , front 的 位 置 
紧邻 rear 之 后 ， 例 如 front = 23 且 rear = 22， 或 是 fom = 0 量 reawr = n 一 1。 请 注意 ， 因 此 该 队列 不 是 
有 nn 个 元 素 ， 否则 该 条 件 也 可 以 由 rear 紧 跟 front 之 后 来 表示 。 因 此 ， 当 该 队列 有 nn 一 1 个 元 素 , 而 不 
是 有 n 个 元 泰 时 , 它 就 已 经 满 了 。 假设 使 用 循环 数组 数据 结构 ， 为 这 些 队列 操作 编写 函数 , 不 要 忘 
了 检查 满 队列 和 空 队 列 。 

(4)* 证明: 如 果 (a,a,,…,q,) 是 以 qj 为 前 端的 队列 ， 那 么 对 i=1,2,…, n 一 1 而 言 ，4; 是 在 a,, 之 前 入 
队 的 。 
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void clear (QUEUE *pQ) 


{ 
pQ->front = NULL ; 
} 
BOOLEAN isEmpty (QUEUE *pQ) 
{ 
return (pQ->front == NULL) ; 
} 
BOOLEAN isFull (QUEUE *pQ) 
{ 
return FALSE ; 
} 
BOOLEAN dequeue (QUEUE *pQ, int *px) 
{ 
if (isEmpty(pQ)) 
return FALSE; 
else { 
(*+px) = pQ->front->element; 
pQ->front = pQ->front->next,; 
return TRUE ; 
} 
} 
BOOLEAN enqueue(int x, QUEUE *pQ) 
{ 
if (isEmpty(pQ)) { 
pQ->front = (LIST) malloc(sizeof (struct CELL) ) ; 
pQ->rear = pQ->front; 
} 
else { 
pQ->rear->next = (LIST) malloc(sizeof (struct CELL) ) ; 
pQ->rear = pQ->rear->next,; 
} 
pQ->rear->element = xXx; 
pQ->rear->next = NULL ; 
return TRUE; 
} 





图 6-29 ”实现 链表 队列 操作 的 例 程 


6.9 ”最 长 公共 子 序列 


本 市 专 门 探讨 一 个 与 表 有 关 的 有 趣 问题 。 假 设 有 两 个 表 ， 而 我 们 想 知 道 这 两 者 之 间 有 何 差 
异 。 该 问题 会 以 很 多 不 同 的 形式 出 现 ， 也 许 最 常见 的 就 是 两 个 表 分 别 表示 茶 文 本 文件 的 两 个 版 
本 ,并 希望 确定 两 个 版 本 有 哪 几 行 相同 的 情况 。 为 简便 起 见 ， 纵 贯 本 市 我 们 部 将 假设 这 些 表 是 
字符 串 。 

考虑 这 一 问题 的 一 种 实用 方式 就 是 将 两 个 文件 当 作 符 号 序列 ，x=a…a, 和 y=b…b,， 其 
中 a 表示 第 一 个 文件 中 的 第 ; 行 ， 而 bj 表示 第 二 个 文件 的 第 ) 行 。 因 此 ， 像 a 这 样 的 抽象 符号 其 实 
也 许 是 个 “大 ”对 象 ， 有 可 能 是 一 整 句 话 。 
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UNIX 命 令 giff 就 可 以 比较 两 个 文本 文件 的 区 别 。 文 件 x 可 能 是 某 程序 当前 的 版 本 ,文件 y 
则 可 能 是 该 程序 在 经 过 某 次 细小 修改 之 前 的 版 本 。 可 以 使 用 diff 提 醒 自 己 在 将 y 变 为 x 时 进行 的 
修改 。 对 文本 文件 的 常见 修改 有 : 

(1) 插入 一 行 ; 

(2) 删除 一 行 。 
而 文本 行 的 修改 可 以 视 为 删除 一 行 之 后 紧 接着 插入 一 行 。 

通常 ， 当 一 个 文本 文件 转化 为 另 一 个 时 , 如 果 对 两 个 文本 文件 间 发 生 的 少量 改变 加 以 检验 ， 
很 容易 发 现 哪些 文本 行 是 与 哪些 行 对 应 的 ， 且 很 容易 看 出 哪些 文本 行 被 删除 了 以 及 哪些 文本 行 
是 新 插入 的 。diff 命 令 作 出 了 这 样 的 假设 , 用 两 个 表 表 示 两 个 文本 文件 ,， 表 中 元 素 是 文本 文件 
中 的 文本 行 ， 于 是 可 以 通过 首先 找 出 两 个 表 的 最 大 公共 子 序列 ( Longest Common Subsequence， 
LCS ) 来 确定 都 有 哪些 改变 。LCS 表 示 那 些 没 有 修改 过 的 文本 行 。 

回想 一 下 , 子 序列 是 在 保留 剩余 元 素 次 序 的 前 提 下 从 表 中 删除 0 个 或 多 个 元 素 得 到 的 。 两 个 
表 的 公共 子 序 列 就 是 同 为 两 者 子 序列 的 表 ， 而 两 个 表 的 最 长 公共 子 序列 就 是 两 个 表 公共 子 序列 
中 最 长 的 那个 。 




















+ 示例 6.12 

在 下 文 的 内 容 中 ， 我 们 可 以 将 a、b 或 这 样 的 字符 视 为 表示 文本 文件 中 的 文本 行 ， 或 者 如 
果 愿 意 的 话 , 视 作 其 他 类 型 的 元 素 。 举例 来 说 , baba 及 cbba 都 是 abcabba 和 cbabac 的 最 长 公 
共 子 序列 。 可 以 看 到 ，baba 是 abcabba 的 子 序列 ， 因 为 从 abcabba 中 选取 位 置 2、4、5 和 7 就 
能 形成 baba。 字符 串 baba 也 是 cbabac 的 子 序列 ， 因 为 可 以 选择 位 置 2、3、4 和 5。 同样 ，cbba 
是 由 abcabba 的 位 置 3、5、6 和 7 形成 的 ， 也 是 由 cbabac 的 位 置 1、2、4 和 5 形成 的 。 因 此 cbba 
也 是 这 些 字符 串 的 公共 子 序列 。 我 们 必须 相信 ， 这 就 是 最 长 公共 子 序 列 ， 也 就 是 说 ， 没 有 长 度 
为 5 或 更 长 的 公共 子 序列 了 。 这 一 事实 可 由 接 下 来 要 描述 的 算法 得 出 。 








6.9.1 对 LCS 计 算 的 递归 


我 们 提供 了 两 个 表 LCS 长 度 的 递归 定义 。 该 定义 使 LCS 长 度 的 计算 变 得 很 容易 ， 而 且 ， 通 
过 检验 它 构 建 的 表 ， 可 以 发 现 一 个 可 能 的 LCS， 而 不 只 是 其 长 度 。 由 该 LCS， 可 以 推断 出 文本 
文件 发 生 了 什么 变化 ， 本 质 上 讲 ， 不 属于 LCS 的 部 分 都 是 变化 。 

要 找 出 表 x 和 表 y 某 个 LCS 的 长 度 , 就 需要 和 弄 清 所 有 前 级 (一 个 来 自 x, 男 一 个 来 自 y ) 对 LCS 
的 长 度 。 回 想 一 下 ， 前 级 是 以 表 首 字母 开头 的 子 表 ， 也 就 是 说 ，cbabac 的 前 级 就 是 e 、c、 
cb、cba， 等 等 ,。 假设 x=(a,q,,…, aq,) 而且 y=(b,b,,…,b,)。 对 每 个 i 和 每 个 ;， 其 中 i 在 0 到 m 
之 间 ， 而 7 在 0 到 n 之 间 ， 都 可 以 要 求 来 自 x 的 前 级 (a,…, a,) 和 来 自 y 的 前 级 (5,…,b,) 的 LCS。 

如 果 三 /之 中 有 一 个 为 0, 那么 其 中 一 个 前 级 就 是 e, 这 样 两 个 前 缀 唯一 可 能 的 公共 子 序列 就 
是 e。 因 此 ， 当 或 之 中 有 一 个 为 0 时 ，LCS 的 长 度 就 是 0。 这 一 直观 结果 可 以 转化 为 在 LCS 计 算 
方式 的 非 正式 讨论 之 后 的 归纳 中 依据 和 规则 (1) 的 正式 形式 。 

现在 考虑 一 下 i 和 ;都 大 于 0 的 情况 。 最 好 将 LCS 视 为 两 个 字符 串 的 某 些 位 置 间 的 匹配 。 也 就 
是 说 ， 对 LCS 的 每 个 元 素 而 言 ， 都 可 以 将 该 元 素 在 两 个 字符 串 中 各 自 所 在 的 位 置 匹配 起 来 。 匹 
配 过 的 位 置 必须 具有 相同 的 符号 ， 而 且 匹 配 过 的 位 置 之 间 的 文本 行 一 定 不 能 交叉 。 
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+ 示例 6.13 
图 6-30a 展 示 了 字符 串 abcabba 和 cbabac 两 种 可 能 匹配 中 对 应 公共 子 序列 baba 的 那 种 ,图 
6-30b 则 展示 了 对 应 cbba 的 匹配 。 





a bc a bb a a bc a bb a 
WE pg 
eb a nb a Te ce Bb a ba CC 


(a) 对 应 baba (b) 对 应 cbba 
图 6-30 ”表示 为 位 置 间 匹 配 的 LCS 


因此 ,我们 来 考虑 前 级 (a,…, a,) 和 (b,…,。,) 之 间 的 匹配 。 存 在 如 下 两 种 情况 ， 具 体 取 决 
于 两 个 表 的 最 后 一 个 符号 是 否 相 等 。 

(a) 如 果 a 冯 5b, ,那么 匹配 中 就 不 可 能 同时 含有 aj 和 5b;， 因 此 (a,…, aq) 和 (Bb,…,5)) 的 LCS 一 
定 是 下 列 两 者 之 一 。 
(0) (oa 和 (人 2) 的 LCS; 
(iD (@,…,@,) 和 (65,…,5b, i) 的 LCS。 
如 果 已 经 得 出 了 上 述 两 对 前 级 的 LCS 的 长 度 ， 就 可 以 取 其 中 的 较 大 值 作为 (a,,…, a,) 和 
(B,…,b,) 的 LCS 的 长 度 。 这 种 情况 将 成 为 接 下 来 的 归纳 中 正式 的 规则 (2)。 

(b) 如 果 a, =b, ， 就 可 以 匹配 a 和 b;， 而 且 该 匹配 将 不 会 妨碍 其 他 任何 可 能 的 匹配 。 因 此 ， 
(Qi,…,4) 和 (Bb,…,b,) 的 LCS 的 长 度 ， 要 比 (a,…, a ,) 和 (45,…,b,,) 的 LCS 的 长 度 大 1。 
这 种 情形 将 成 为 接 下 来 的 归纳 中 正式 的 规则 (3)。 
这 些 直 观 结果 让 我 们 给 出 了 LGi, 刀 (qa,…,4,) 和 (6b,,…,b,) 的 LCS 的 长 度 一 一 的 递归 
定义 。 其 中 利用 了 对 it7 的 和 的 完全 归纳 。 

依据 。 如 果 iti = 0， 那 么 i 都 为 0， 所 以 LCS 是 e。 因 此 L(0,0) = 0。 

归纳 。 考 虑 iI， 并 假设 已 经 为 满足 g+h<=i+t j 的 任意 ge 和 hh 计算 出 L(g, 万。 有 如 下 3 种 情况 

(1) 如 果 1 或 中 有 一 个 为 0， 那 么 L(i, j) = 0。 

(2) 如 果 i>0 且 疡 0， 而 且 w 5b,， 那 么 L(Gi, 站 = max (L(Gi,j--D),L(i-1,7))。 

(3) 如 果 产 0 且 这 0 ， 而且 a,=b,， 那 么 LGi, 站 = 1+L(i-1,j-1)。 


6.9.2 ”用 于 LCS 的 动态 规划 算法 


我 们 最 终 想 要 的 是 L(m,n)， 即 表 x 和 表 y 的 LCS 的 长 度 。 如 果 根 据 之 前 的 归纳 编写 递归 程序 ， 
它 所 花 的 时 间 是 m 和 n 的 较 小 者 的 指数 。 这 一 简单 的 递归 算法 对 n= m=100 这 样 的 情况 而 言 要 花 
上 太 多 太 多 的 时 间 。 这 一 递归 表现 如 此 糟糕 的 原因 有 些 复杂 。 首 先 ， 假设 表 x 和 表 y 中 的 字符 间 
完全 没有 匹配 ,并 调用 ZL(3,3)。 这 会 带 来 对 L(2,3) 和 ZL(3,2) 的 调用 ,而 这 两 次 调用 又 都 会 带 来 对 L(2,2) 
的 调用 。 因 此 就 要 将 L(2,2) 的 工作 完成 两 帝 。 随 着 L 的 参数 变 小 ，L(iy) 的 调用 次 数 会 迅速 增加 。 
如 果 将 调用 追踪 继续 下 去 ， 就 会 发 现 ，L(1,1) 被 调用 了 6 次 ，L(0,1) 和 L(1,0) 各 被 调用 了 10 次 ， 而 
ZL(0,0) 被 调用 了 20 次 。 
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如 果 构 建 二 维 表 或 二 维 数组 来 存储 对 应 不 同和 的 L(i, 妃 ， 就 可 以 有 更 佳 的 表现 。 如 果 按 照 
归纳 的 次 序 计算 这 些 值 ， 也 就 是 说 先 从 最 小 的 (i+) 的 值 开 始 计算 ， 那 么 在 计算 LGi, 四 时 所 需 的 L 
的 值 总 是 在 表 中 。 其 实 ， 了 逐 行 计算 L 要 更 简单 ， 也 就 是 对 i =0，1，2 等 计算 A， 而 在 一 行 之 中 ， 
要 按 列 计算 K， 也 就 是 对 j= 0，1 ，2 等 计算 L。 在 计算 LGi,) 时 ， 还 是 一 定 能 够 在 表 中 找到 所 需 的 
值 ， 而 且 不 需要 进行 递归 调用 。 这 样 一 来 ， 计 算 表 中 每 一 项 都 只 需要 花费 OU) 的 时 间 ， 而 要 构 
建 二 维 表 表 示 长 度 分 别 为 m 和 n 的 表 的 LCS， 需 要 花 的 时 间 是 O(mn) 。 

图 6-31 展 示 了 填充 该 表 的 C 语 言 代 码 ， 是 按 行 处 理 而 非 按 iti 的 和 人 处理 的 。 假设 表 x 存储 在 数 
组 4[1..m] 中 ， 而 表 y 存 储 在 b[1..n] 中 。 请 注意 ， 数 组 中 标号 为 0 的 元 素 未 被 使 用 ， 这 样 做 简化 了 
图 6-31 中 的 表示 法 。 这 里 将 证 明 该 程序 处 理 长 度 分 别 为 m 和 和 nn 的 表 的 运行 时 间 为 O(mn) 的 工作 留 
作 本 节 习 题 。” 

















for (j = 0; j <= n; j++) 
L[0] [j] = 0; 

for (i = 1; i <= m; i++) { 
L[i][0] = 0; 


for (j = 1; j <= n; j++) 
if (a[i] != b[j]) 
if (L[i-1][j] >= L[i][j-1]) 
L[i] [j] = L[i-1][j]; 
else 
L[i] [j] = L[i][j-1]; 
else /* a[i] == b[j] */ 
L[i] [j] = 1 + L[i-1][j-1]; 








图 6-31 填充 LCS 表 的 C 语 言 程序 片段 





动态 规划 


术语 “动态 规划 ” 源 自 R.E. Bellman 在 1950 年 为 解决 控制 系统 中 的 问题 所 提出 的 一 般 理论 。 
而 人 工 智 能 领域 的 工作 者 通常 会 将 这 一 技术 称 为 备 忘 ( memoing ) 或 制 表 (tabulation )。 





像 本 例 这 样 的 填 表 技术 通常 称 为 动态 规划 算法 ( dynamic programming algorithm )。 这 种 情 
况 下 ， 它 比重 复 为 相同 子 问题 求解 的 直接 递归 实现 更 高 效 。 





+ 示例 6.14 

设 x 是 表 cbabac，y 是 表 abcabba。 图 6-32 展 示 了 为 这 两 个 表 构 建 的 二 维 表 。 例 如 ，L(6,7) 
是 a,b, 的 情况 。 因 此 ZL(6,7) 就 是 它 下 方 和 左 侧 两 个 项 中 的 较 大 者 。 因 为 这 两 项 分 别 为 4 和 3， 所 
以 我 们 右上 角 的 项 L(6,7) 置 为 4。 现 在 考虑 一 下 L(4,5)。 因 为 4 和 a;s 都 是 符号 bp， 所 以 在 L(4,5) 左 下 
的 L(3,4) 这 项 上 加 1。 因 为 该 项 为 2， 所 以 将 L(4,5) 置 为 3。 











QD 严格 地 讲 , 我 们 只 讨论 了 是 一 个 单 变量 函数 的 大 0 表达 式 。 不 过 ,这 里 要 表达 的 意思 应 该 是 明了 的 。 如 果 T(m,n) 
是 该 程序 处 理 长 度 为 m 和 nn 的 表 的 运行 时 间 ， 那 么 存在 常数 m。、no 和 c， 使 得 对 所 有 的 m 宇 m, 和 nn 宇 n, ， 都 有 


T(m,n) < cmn 。 


262 第 6 章 表 数 据 模 型 





OO 5 bp TT pp oO 

OP NW oO 

en Ee Me = ts = es es 
IO OO 一 一 ~ 
DIOC OP 一 DD oO LY 

tO Co ES Ee RD BD © 
BB | WD 6 
A 也 IOP DH 人 相 


EF 口 Fi co oo 
pp 


3 
3 
3 
2 
1 
0 
6 
b 
序 


列 的 二 维 表 


和 
S 


NS 


图 6-32 ”对 应 cbabac 和 abcabba 最 长 公共 子 


6.9.3 ”LCS 的 恢复 


现在 就 得 到 了 能 给 出 LCS 长 度 的 二 维 表 ， 不 仅 能 给 出 问题 中 两 个 表 的 LCS 的 长 度 ， 而 且 可 
以 给 出 它们 每 对 前 缀 的 LCS 的 长 度 。 从 这 些 信息 一 定 能 推导 出 问题 中 两 个 表 可 能 的 LCS 之 一 。 
要 完成 这 一 工作 ， 就 要 找到 形成 LCS 之 一 的 匹配 元 素 对 。 我 们 会 找到 一 条 从 右上 角 开 始 穿 越 该 
二 维 表 的 路 径 ， 而 这 一 路 径 将 确定 一 个 LCS 。 

假设 这 条 从 右上 和 角 开 始 的 路 径 已 经 将 我 们 带 到 了 第 ; 行 第 j 列 ,也 就 是 该 二 维 表 中 对 应 元 素 对 
4 和 ,的 点 。 如 果 a,=b,，L(i, 站 就 是 1+LG 一 4,j 一 1) 。 因 此 可 以 将 w 和 户 当 作 已 匹配 的 元 素 对 ， 
而 且 我 们 会 把 w ( 也 是 b; ) 表示 的 符号 包含 在 LCS 中 ， 并 排 在 目前 为 止 所 有 已 被 找到 的 LCS 元 素 
之 前 。 然 后 将 路 径 癌 左下 移动 ， 也 就 是 说 移动 到 第 计 1 行 第 -1 列 。 

不 过 ,也 可 能 a, #5, 。 如 果 这 样 ,LGi, 让 肯定 至 少 与 7(i-1, 让 和 L(Gi,j-1) 中 的 某 一 个 是 相等 的 。 
如 果 ZL(i, 门 = ZL(i-1, 让 ， 就 会 把 路 径 向 下 移动 一 行 ， 否 则 ， 就 知道 L(Gi, 站 = Li,j-1)， 就 会 把 路 径 问 
左 移动 一 列 。 

遵循 这 一 规则 ， 最 终 会 到 达 左 下 角 。 至 此 ， 就 已 经 选 定 了 一 个 作为 LCS 的 元 素 序 列 ， 而 且 
该 LCS 本 身 也 是 由 这 些 元 素 组 成 的 表 ， 表 中 元 素 的 次 序 与 它们 被 选 定 的 次 序 是 相反 的 。 
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图 6-33 ”找到 最 长 公共 子 序列 cbba 的 路 径 


D> 
NS 


+ 示例 6.15 
图 6-33 再 次 展示 了 图 6-32 中 的 二 维 表 ， 并 将 路 径 加 粗 表 示 出 来 。 我 们 从 值 为 4 的 L(6,7) 开 始 。 
因为 a,。 zzb, ， 所 以 立刻 向 左 和 向 下 寻找 值 4， 它 至 少 会 在 这 两 个 位 置 中 的 一 个 出 现 。 在 本 例 中 ， 
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4 出 现在 ZL(6,7) 下 方 ， 所 以 我 们 移动 到 L(5,7)。 现 在 有 as 5b, ， 都 是 a。 因 此 a 就 是 该 最 长 公共 子 
序列 中 最 后 的 符号 ， 于 是 我 们 移 向 左下 方 ， 移 动 到 Z(4,6)。 

因为 a 和 be 都 是 5p， 所 以 将 b 放 和 人 正在 成 形 的 LCS 中 ， 位 于 a 之 前 ， 而 我 们 继续 向 左下 移动 ， 
移动 至 L(3,5)。 这 里 ,我 们 发 现 a, 5b, ， 不 过 ZL(3,5) 的 值 为 2， 与 它 下 面 和 左边 的 项 都 相等 。 在 这 
种 情况 下 我 们 选择 向 下 移动 ， 所 以 接 下 来 要 移动 到 L(2,5)。 在 该 点 会 看 到 a, = b; = pb， 所 以 我 们 
将 b 放 在 正在 成 形 的 LCS 前 头 ， 并 继续 向 左下 移动 到 Z(1,4)。 

因为 a bp,，L(1,4) 只 有 在 它 左边 的 项 ,而且 该 项 有 着 与 它 相 同 的 值 1， 所 以 我 们 移动 到 
ZL(1,3)。 现 在 有 a =b, =c， 因 此 可 以 将 c 添 加 到 LCS 的 前 端 ， 并 移动 到 ZL(0,2)。 至 此 ， 我 们 别 无 
选择 ， 只 能 向 左 移动 到 ZL(0,1)， 然 后 移动 到 L(0,0)， 最 终 完成 了 这 条 路 径 。 得 到 的 LCS 由 我 们 发 
现 的 4 个 字符 按 反 序 组 成 ,就 是 cpba。 这 刚好 是 我 们 在 示例 6.12 中 提 到 的 两 个 LCS 之 一 。 要 得 到 
其 他 的 LCS, 可 以 在 Z(Gi, 有 站) 与 L(i-1, 广 和 ZL(i,j-1) 都 相等 时 选择 向 左 移动 而 非 向 右 移动 ,并 且 在 L(i-1， 
刀 和 7Z(, 六 1) 其 中 之 一 等 于 L(iy) 时 ， 选 择 问 左 或 向 右 移动 ， 即 便 是 在 a, = 忆 的 情况 下 ( 即 跳 过 某 
些 匹 配 而 直接 到 达 其 左边 的 匹配 )。 

可 以 证 明 ， 这 一 寻 路 算法 总 能 找到 最 大 公共 子 序 列 。 我 们 要 利用 对 两 个 表 长 度 之 和 进行 完 
全 归纳 加 以 证 明 的 命题 如 下 。 

命题 S(k) 。 如 果 在 第 ; 行 第 j 列 ， 其 中 i+ j =k  ， 而 且 有 Zi, 站 =v， 我 们 随后 就 会 在 LCS 中 
找到 vy 个 元 素 。 

依据 。 依 据 是 上 = 0 的 情况 。 如 果 i+ j=0， 那么 i 和 j 都 为 0。 我 们 已 经 完成 了 路 径 ， 并 发 现 
LCS 不 会 有 更 多 元 素 。 因 为 已 经 知道 ZL(0,0) =0， 所 以 归纳 假设 对 i+ j=0 成 立 。 

归纳 ,假定 对 {或 更 小 的 和 的 归纳 假设 成 立 , 并 令 i+ j=k+1 ,假设 我 们 在 值 为 v 的 LGi, 7 处 。 
如 果 a, =b, ， 就 找到 了 匹配 并 移动 到 ZC-17-D 。 因 为 GC-D+G=-D 的 和 小 于 i+1， 所 以 归纳 
假设 是 适用 的 。 因 为 L(i -1,j--1) 一 定 是 v-1， 所 以 我 们 知道 LCS 还 将 找到 v-1 个 元 素 ， 再 加 上 已 
经 找到 的 一 个 元 素 ， 就 会 给 我 们 v 个 元 素 。 这 一 直观 结果 证 明了 这 种 情况 下 的 归纳 假设 。 

唯一 的 例外 是 a, # 忆 的 情况 。 这 种 情况 下 ，ZG-L1 旋 或 ZG,7-D ， 或 者 这 两 者 ， 一 定 具 有 
值 v”， 而 且 我 们 要 移动 到 具有 值 y 的 这 些 位置 之 一 。 因 为 任 一 情况 下 行列 值 的 和 都 是 ;+7-1， 所 
以 归纳 假设 是 适用 的 , 这 样 就 能 得 出 在 LCS 中 找到 v 个 元 素 的 结论 。 这样 我 们 又 能 得 出 S(k+]) 为 
真 的 结论 。 因 为 已 经 考虑 了 所 有 的 情况 ,所 以 就 完成 了 证 明 ,， 并 可 以 说 如 果 在 数据 项 L(i, 7 处 ， 
就 总 是 在 LCS 找 出 LGi, j) 个 元 素 。 


6.9.4 习题 
(1) 下 列表 的 LCS 的 长 度 各 为 多 少 ? 


(a) banana 和 cabana 
(b) abaacbacab 和 lbacabbcaba 

(2) * 找到 习题 (1) 两 个 小 题 中 两 个 表 的 所 有 LCS。 提 示 : 在 为 习题 (1) 构 建 二 维 表 之 后 ， 从 右上 角 往 回 
追溯 ， 在 遇 到 有 两 条 或 三 条 不 同 路 径 的 点 时 ， 要 顺 着 每 种 选择 继续 移动 。 

(3) ** 假设 使 用 我 们 最 先 描述 的 递归 算法 而 不 是 推荐 的 填 表 程序 计算 LCS。 如 果 对 两 个 没有 共同 符号 
的 表 调 用 ZL(4,4)， 要 执行 多 少 次 对 ZL(1,1) 的 调用 ? 提示 : 使 用 填 表 (动态 规划 ) 算法 计算 二 维 表 ， 
给 出 对 应 所 有 ij 的 L(Gi,j) 的 值 。 将 计算 结果 与 4.5 节 中 的 帕斯卡 三 角 相 比较 。 这 一 关系 表示 了 与 
调用 次 数 的 公式 有 关 的 哪些 信息 ? 

(4) ** 假设 有 表 x 和 表 y， 且 二 者 的 长 度 均 为 4。 当 n 小 到 一 定 程度 之 后 ， 就 最 多 只 有 一 个 字符 串 是 x 和 y 
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的 LCST 了 了， 虽然 该 字符 串 可 能 出 现在 x 和 /或 y 的 不 同位 置 。 例 如 ， 如 果 n=1， 那么 LCS 只 能 是 6， 
除非 x 和 y 都 是 同一 个 符号 a, 这 种 情况 下 a 就 是 唯一 的 LCS。 那么 , 让 x 和 y 可 以 有 两 个 不 同 LCS 的 最 
小 n 值 是 多 少 ? 

(5) 证 明 图 6-31 所 示 的 程序 运行 时 间 为 O(mn) 。 

(6) 编写 C 语 言 程 序 ， 接 受 图 6-31 所 示 程 序 计算 出 的 那 种 表 ， 并 找 出 LCS 在 各 字符 串 中 的 位 置 。 如 果 该 
表 的 规格 为 mxn ， 那 么 这 一 程序 的 运行 时 间 是 多 少 ? 

(7) 在 6.9 节 开头 ， 我 们 表示 过 LCS 的 长 度 是 与 两 个 字符 串 最 大 位 置 匹配 的 大 小 有 关 的 。 
(a*) 通过 对 Kk 的 归纳 证 明 ， 如 果 两 个 字符 串 有 着 长 度 为 的 公共 子 序列 ， 那 么 它们 也 有 着 长 度 为 

的 匹配 。 

(b) 证 明 : 如 果 两 个 字符 串 有 长 度 为 的 匹配 ， 那 么 它们 也 有 长 度 为 的 公共 子 序列 。 
(c) 由 (a) 和 (b) 得 出 ，LCS 的 长 度 与 匹配 的 最 大 值 其 实 是 一 回 事 。 





6.10 ”字符 串 的 表示 


字符 串 可 能 是 实践 过 程 中 最 常见 的 表 的 形式 。 表 示 字 符 串 的 方法 数不胜数 ， 而 且 其 中 一 些 
技巧 很 难 适用 于 其 他 类 型 的 表 。 因 此 ， 本 市 专门 介绍 一 些 与 字符 串 有 关 的 特殊 问题 。 

首先 ， 应 该 意识 到 存储 单个 字符 串 基 本 不 成 问题 。 通 常 ， 我 们 有 大 量 很 短 的 字符 串 。 它 们 
可 能 形成 词典 , 意味 着 我 们 可 以 随 着 时 间 的 推移 插入 和 删除 字符 串 , 也 可 能 是 静态 字符 串 集合 ， 
时 间 再 久 也 不 会 改变 。 下 面 要 讲 两 个 典型 的 例子 。 

(1) 字母 索引 是 一 种 研究 文本 的 实用 工具 ， 它 是 由 文档 中 使 用 过 所 有 单词 以 及 这 些 单词 出 
现 的 位 置 构成 的 表 。 在 大 型 文档 中 通常 会 有 成 二 上 万 个 不 同 的 单词 ， 而 单词 每 出 现 一 次 就 要 被 
存储 一 次 。 这 一 单词 集合 是 静态 的 ， 也 就 是 说 ， 一 旦 成 形 就 不 会 改变 ， 除 非 原 有 的 字母 索引 中 
存在 错误 。 

(2) 将 C 语 言 程序 转化 为 机 融 代 码 的 编译 需 必 须 记 录 表 示 程 序 变量 的 所 有 字符 串 。 大 型 程序 
可 能 拥有 成 百 上 千 的 变量 名 。 想 想 看 , 分 别 在 两 个 函数 中 声明 的 局 部 变量 i， 其 实 是 两 个 不 同 的 
变量 ,这 样 就 能 明日 为 什么 会 有 如 此 多 的 变量 了 。 随 着 编译 带 对 程序 加 以 扫描 ,会 找到 新 的 变 
量 名 ， 并 将 其 插入 变量 名 集合 中 。 一 旦 编译 带 完 成 了 函数 的 编译 ,该 函数 的 变量 对 随后 的 函数 
来 说 便 不 可 用 了 ， 因 此 可 以 删除 掉 。 

在 这 两 个 例子 中 ， 都 存在 很 多 短 字 符 串 。 英 语 中 的 短 单词 比比 几 是 ， 而 程序 员 则 喜欢 用 ii 
或 x 这 样 的 字母 表示 变量 。 男 一 方面 , 不 管 是 在 类 语文 本 还 是 在 程序 中 , 单词 的 长 度 都 是 没有 限 
制 的 。 


6.10.1 _C 语 言 中 的 字符 串 


C 语 言 程序 中 可 能 出 现 字 符 串 常量 , 而 它们 会 被 存储 为 字符 数组 , 后 面 跟 上 名 为 空 字符 (null 
character ) 且 值 为 0 的 特殊 字符 “0”。 不 过 ， 在 上 面 提 到 的 应 用 中 ， 我 们 需要 随 着 程序 运行 而 
创建 并 存储 新 字符 串 的 便利 。 因 此 ， 需 要 能 向 其 中 存储 任意 字符 串 的 数据 结构 。 其 中 一 些 可 能 
下 

(1) 使 用 定 长 数组 存放 字符 串 。 比 数组 短 的 字符 串 之 后 由 空 学 符 补 齐 。 而 比 数组 长 的 字符 串 
不 能 完整 地 存储 到 数组 中 ， 它 们 必须 被 截断 ， 只 将 长 度 与 数组 长 度 相等 的 前 级 存储 到 数组 中 。 

CO) 与 4) 类 似 的 模式 ,但 假设 每 一 个 字符 串 或 被 截断 字符 串 的 前 级 之 后 都 有 一 个 空 字符 。 
这 种 方式 简化 了 字符 串 的 读 操 作 ， 但 它 让 数组 中 可 以 存储 的 字符 串 的 长 度 减少 了 1。 
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(3) 与 () 类 似 的 模式 ， 它 不 会 在 字符 串 后 放置 空 学 符 ， 而 是 用 男 一 个 整数 length 指 示 字 符 串 
的 真实 长 度 。 

(4) 要 避免 最 大 字符 串 长 度 的 限制 , 可 以 将 字符 串 中 的 字符 存储 为 链表 元 素 ,， 而 且 可 以 将 多 
个 字符 存储 在 一 个 单元 中 。 

(5) 可 以 创建 大 型 字符 数组 , 将 很 多 单独 的 字符 串 放 置 其 中 。 而 每 个 字符 串 就 由 指向 该 字符 
串 开 头 字符 在 该 数组 中 位 置 的 指针 表示 。 字符 串 可 能 以 空 字符 结尾 , 也 可 能 有 与 之 关联 的 长 度 。 


6.10.2 定 长 数组 表示 


我 们 来 考虑 一 下 上 述 第 (1) 类 结构 ， 其 中 字符 串 是 由 定 长 数组 表示 的 。 在 下 面 的 例子 中 ,我 
们 会 创建 拥有 定 长 数组 作为 其 中 一 个 字段 的 结构 体 。 


+ 示例 6.16 

考虑 一 下 用 来 存放 索引 中 某 一 项 ， 即 单个 单词 以 及 与 其 相关 的 信息 的 数据 结构 。 我 们 需要 
存放 下 列 内 容 。 

(1) 单词 本 身 ; 

(2) 单词 出 现 的 次 数 ; 

(3) 表示 文档 中 文本 行 的 表 ， 该 单词 会 在 其 中 出 现 一 次 或 多 次 。 

因此 可 以 使 用 如 下 结构 体 : 


typedef struct { 
char Word[MAX] ; 
int occurrences; 
LIST lines; 

} WORDCELL ; 


这 里 的 MAX 是 指 单词 的 最 大 长 度 。 所 有 的 WORDCELL 结 构 体 都 包含 一 个 名 为 word 的 有 MAX 
个 字 节 的 数组 ， 不 管 要 存放 的 单词 到 底 有 多 短 。 

字段 occurtence 是 计算 某 单词 出 现 次 数 的 计数 句 ， 而 Lines 则 是 指 回 链 表 开 头 的 指针 。 
链表 中 的 单元 具有 由 以 下 宏 定义 的 常规 类 型 : 

DefCell (int, CELL, LIST); 
每 个 单元 存放 着 一 个 整数 ， 表 示 出 现 问题 中 单词 的 文本 行 。 请 注意 ， 如 果 某 个 单词 在 一 行 中 出 
现 符 干 次 ,那么 occurrence 就 要 比 表 的 长 度 更 大 。 

在 图 6-34 中 ， 我 们 看 到 表示 《圣经 . 创 世 记 》 第 1 章 中 的 单词 sarth 的 结构 体 。 假 设 MAX 
至 少 为 6。 表 示 行 (诗句) 号 的 完整 表 是 (1, 2, 10, 11, 12, 15, 17, 20, 22, 24,，25，26，28， 
29, 30)。 




















WOord : "earthNOn 


occurrences: 20 
lines: 1 2 10 和 30| 。| 
图 6-34 单词 eartn 在 《圣经 : 创 世 记 》 第 1 章 中 的 索引 项 
整个 索引 可 能 是 由 一 系列 WORDCELL 类 型 的 结构 体 组 成 的 。 例 如 ， 这 些 结构 体 可 以 被 组 织 
为 一 棵 二 又 查 找 树 ， 有 着 基于 单词 字母 顺序 的 < 次序。 在 使 用 字母 索引 时 ， 该 结构 体 可 以 提供 
相当 高 的 单词 访问 速度 。 而 随 着 我 们 不 断 扫描 文本 ， 找 到 并 列 出 各 单词 的 出 现 ， 它 还 能 让 我 们 
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高 效 地 创建 索引 。 要 使 用 二 义 树 结构 ， 就 需要 在 类 型 WORDCELL 中 定义 表示 左 子 节点 和 右 子 节 
点 的 字段 。 我 们 还 可 以 在 原始 的 WORDCELL 类 型 定义 中 加 入 “next” 字 段 ， 从 而 将 这 些 结构 体 排 
列 在 链表 中 。 这 是 一 种 更 简单 的 结构 ， 不 过 如 果 单 词 数 量 众多 ， 它 的 效率 就 要 差 不 少 。 我 们 在 
第 7 章 中 将 会 看 到 如 何在 散 列 表 中 排列 这 些 结构 体 , 这 基本 上 是 解决 这 一 问题 的 所 有 数据 结构 中 
性 能 最 佳 的 。 


6.10.3 ”字符 串 的 链表 表示 


字符 串 长 度 的 限制 ， 以 及 不 管 字 符 串 有 多 短 都 需要 分 配 固定 量 的 空间 ， 这 是 字符 串 定 长 数 
组 实现 的 两 大 缺点 。 不 过 ，C 语 言 和 其 他 语言 都 允许 使 用 者 构建 其 他 更 为 灵活 的 数据 结构 来 表 
示 字 符 串 。 例 如 ， 如 果 和 希望 字符 串 长 度 没 有 上 限 ， 可 以 使 用 常规 的 字符 链表 存放 字符 串 。 也 就 
是 ， 可 以 声明 如 下 类 型 : 

typedef struct CHARCELL *CHARSTRING; 

struct CHARCELL { 


char character; 
CHARSTRING next; 

















}; 
在 类 型 WORDCELL 中 ，CHARSTRING 成 了 word 字 段 的 类 型 ， 如 : 


typedef { 
CHARSTRING word; 
int occurrences; 
LIST lines; 

} WORDCELL ; 


例如 ， 单 词 earth 可 以 表示 为 


国 革 sy 国医 =, 国医 s 国 车 =. 国 因 

这 种 模式 消除 了 单词 长 度 的 上 限 ， 不 过 在 实际 应 用 中 ， 对 空间 的 利用 却 不 是 很 好 。 原 因 在 于 ， 
假设 用 1 个 字 市 表示 字符 ， 并 且 通 常用 4 个 字 节 表示 指向 链表 下 一 个 单元 的 指针 ， 那 么 每 个 
CHARCELIL 类 型 的 结构 体 至 少 要 占用 5 个 字 方 。 因 此 ， 绝 大 部 分 空间 是 由 指针 的 “系统 开销 ” 占 
用 的 ， 只 有 少 部 分 空间 是 由 字符 的 “有 效 负 载 ” 使 用 的 。 

不 过 可 以 更 灵活 些 ， 将 才干 字 节 打包 装 和 人 每 个 单元 的 数据 字段 。 例 如 ， 如 有 果 在 每 个 单元 中 
放 入 4 个 字符 ， 而 指针 还 是 消耗 4 个 字 节 ， 那 么 就 有 一 半空 间 是 由 “有 效 负 载 ” 使 用 的 ， 而 每 单 
元 一 个 字符 的 模式 只 有 20% 的 有 效 负 载 。 唯 一 要 注意 的 地 方 是 ， 必 须 用 某 一 字符 〈 比 如 说 空 字 
符 ) 作为 字符 串 终 止 字 符 ， 就 像 存 储 在 数组 中 的 字符 串 所 做 的 那样 。 一 般 而 言 ， 如 果 CPC 
( Characters Per Cell， 每 单元 字符 数 ) 是 我 们 希望 在 一 个 单元 中 放置 的 字符 数 ， 就 可 以 按照 如 下 
声明 定义 单元 : 

typedef struct CHARCELL *CHARSTRING; 

struct CHARCELL { 


char characters [CPC] ; 
CHARSTRING next; 

















例如 ， 如 果 cPC=4， 就 可 以 将 单词 earth 存 储 在 两 个 单元 中 ， 形 如 : 


加 辣 
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也 可 以 将 cPc 增 加 到 4 以 上 。 这 样 做 的 话 ， 指 针 所 占 空间 的 比例 进一步 下 降 ， 这 是 很 好 的 情 
况 ， 意 味 着 使 用 链表 的 系统 开销 下 降 了 。 男 一 方面 ， 如 果 使 用 非常 大 的 cPC 值 ， 就 会 发 现 ， 几 
乎 所 有 单词 都 只 需要 使 用 一 个 单元 ,但 是 该 单元 中 可 能 有 很 多 未 使 用 的 位 置 ， 就 像 长 度 为 cPC 
的 数组 那样 。 


+ 示例 6.17 
假设 在 所 有 的 字符 串 中 , 有 30% 是 长 为 1 到 4 个 字符 的 字符 串 ,，40% 是 长 5 到 8 个 字符 的 ，20% 
是 9 到 12 个 字符 的 ， 还 有 10% 是 13 到 16 个 字符 的 。 图 6-35 中 的 表 给 出 了 表示 4 个 范围 的 单词 的 链 
表 ， 在 CPC 分 别 为 4、8、12 和 16 时 所 占 的 字 市 数 。 就 我 们 假设 的 单词 出 现 频率 而 言 ，CPC= 8 的 
结果 最 佳 ,平均 要 使 用 15.6 个 字 市 。 也 就 是 说 , 每 个 单元 最 好 用 8 个 字 节 存放 字符 ,加 上 存放 next 
指针 的 4 个 字 节 ,， 即 每 个 单元 总 共 要 使 用 12 个 字 节 。 请 注意 总 空间 开销 , 在 加 上 指向 表 前 端的 指 
针 之 后 ， 就 达到 了 19.6 字 节 ， 就 不 如 使 用 16 字 节 的 字符 数组 那么 好 了 。 不 过 ， 这 种 链表 模式 也 
可 以 容纳 长 度 超过 16 个 字符 的 字符 串 ， 虽 然 这 里 假设 找到 这 样 这 种 字符 串 的 概率 为 0。 
每 单元 字符 数 
16 
20 

















20 

20 

20 
平均 16.8 15.6 17.6 20.0 








图 6-35” 当 cpPc 为 不 同 值 时 ， 不 同 长 度 范 围 的 字符 串 使 用 的 字 节 数 


6.10.4 ”字符 串 的 海量 存储 


还 存在 另 一 种 存储 大 量 字符 串 的 方法 ， 它 兼 具 数组 存储 的 优势 〈 低 系统 开销 ) 与 链表 存储 
的 优势 ( 因为 填充 而 不 浪费 空间 ， 且 字符 串 长 度 无 限制 ) 我 们 创建 一 个 非常 长 的 字符 数组 ,并 
将 每 个 字符 串 都 存储 到 这 一 数组 中 。 为 了 区 分 一 个 字符 串 的 结束 与 下 一 个 字符 串 的 开始 ， 需 要 
一 个 名 为 端 记 号 ( endmarker ) 的 特殊 字符 。 庙 记号 字符 不 是 合法 字符 串 的 一 部 分 。 尽 管 选 择 不 
打印 的 字符 ( 比如 空 字 符 ) 是 更 常见 的 , 不 过 为 了 便于 识别 , 在 接 下 来 的 内 容 中 会 使 用 * 作 为 端 


记号 


+ 示例 6.18 


假设 通过 














char space[MAX] ; 
声明 数组 space。 然 后 就 可 以 通过 给 出 指向 某 单 词 在 space 数 组 中 第 一 个 位 置 的 指针 来 存储 该 
单词 了 。 模 仿 示例 6.16 中 WORDCELL 结 构 体 的 woORDCEILIL 结 构 就 是 : 
typedef struct { 
char *word; 
int occurrences; 


LIST lines; 
} WORDCELL ; 


在 图 6-36 中 ,我 们 看 到 表示 《圣经 : 创 世 记 》 的 字母 索引 中 单词 the 的 WORDCELL 结 构 体 。 不 过 
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接 下 来 的 情况 并 不 是 这 样 。 即 便 接 下 来 的 元 素 中 含有 beginning、God 和 createdq，space 数 
组 也 不 会 出 现 第 二 个 the 了 。 通过 增加 WORDCELL 结 构 体 中 对 应 单词 the 的 occurrences 的 值 ， 


该 单词 就 被 记录 在 列 了 。 随 着 在 这 本 书 中 继续 癌 前 处 理 ， 发 现 单 词 更 多 的 重复 ，space 数 组 中 
的 项 就 不 再 像 《 圣 经 》 原 文 那样 了 。 
word: 


occurrences: 1377 


lines: 1 | 一 


space: 








图 6-36 ”通过 字符 串 空间 的 索引 表示 单词 


就 像 示 例 6.16 中 那样 , 示例 6.18 中 的 结构 体 也 可 以 通过 添加 指向 WORDCELL 结 构 体 的 合适 指 
针 字 上 段 形 成 二 又 查 找 树 或 链表 这 样 的 数据 结构 ,函数 IWi, 瑟 ) 可 以 按照 两 个 WORDCELL 类 型 结构 
体 玫 和 了 静 的 word 字 段 的 词典 顺序 对 二 者 加 以 比较 。 

要 使 用 这 样 的 二 义 查 找 树 构 建 索 引 , 需要 使 用 指针 available 指 问 space 数 组 中 第 一 个 未 
被 占用 的 位 置 。 一 开始 ，available 指 向 space[0]。 假 设 对 要 构建 索引 的 文本 进行 扫描 ， 并 
且 找 到 下 一 个 单词 ， 比 方 说 是 the。 我 们 现在 不 知道 the 是 否 已 经 在 二 又 查 找 树 中 ,因此 要 临时 
将 the* 添 加 到 available 指 问 的 位 置 以 及 接 下 来 的 3 个 位 置 中 。 记 住 ， 这 一 新 添加 的 单词 要 占 
用 4 个 字 节 。 

现在 可 以 在 二 又 查找 树 中 查找 单词 the 了。 如 果 找 到 该 单词 ， 就 在 其 出 现 次 数 的 计数 器 上 
加 1， 并 将 当前 行 插入 表示 文本 行 的 表 中 。 如 果 示 找到， 就 创建 含有 WORDCELL 结 构 体 的 各 个 字 
段 以 及 左 子 节点 和 右 子 节点 指针 ( 都 为 NULL ) 的 新 节点 ， 并 将 其 插入 树 中 合适 的 位 置 。 我 们 将 
新 节点 的 worqd 字 段 置 为 available， 这 样 一 来 它 就 指向 我 们 这 里 单词 the 的 副本 了 。 再 将 
occurrences 置 为 1 ， 并 创建 由 当前 文本 行 的 组 成 的 表示 字段 1ines 的 表 。 最 后 ， 必 须 给 
available 加 上 4， 因 为 现在 已 经 把 单词 the 永 久 地 加 入 space 数 组 了 。 








空间 用 尽 时 会 发 生 什 么 情况 ? 
我 们 假设 了 space 是 足够 大 的 ,从 而 总 是 有 空间 容纳 新 添加 的 单词 。 实 际 情况 是 , 每 当 添 
加 新 的 字符 时 ， 我 们 都 必须 注意 当前 写 入 字符 的 位 置 一 定 要 小 于 MAX。 
如 果 想 在 空间 用 尽 后 输入 新 的 单词 ， 就 需要 准备 好 在 旧 块 用 尽 后 获得 新 空间 块 。 并 不 是 创 
建 数 组 space， 而 是 要 定义 字符 数组 类 型 
typedef char SPACE[MAX]; 
接着 可 以 按照 如 下 定义 创建 新 数组 ， 其 中 available 指 向 数组 的 第 一 个 字符 。 
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available = (char *) malloc(sizeof(SPACE) ) ; 


只 要 直接 赋值 


last = available + MAX; 


就 能 得 到 该 数组 的 末端 了 。 


然后 可 以 向 available 指 向 的 数组 插入 单词 。 如 果 没 办 法 再 往 该 数组 中 装 入 单词 ， 就 可 


以 调用 malloc 创 建 另 一 个 字符 数组 。 当 然 ， 一定 要 注意 不 要 让 写 操作 越过 数组 的 末端 ， 而 且 
如 果 遇 到 长 度 大 于 MAX 的 字符 事 ， 就 没 办 法 以 这 种 模式 存储 单词 了 。 





6.10.5 “习题 


(1) 针对 示例 6.16 中 讨论 的 结构 体 类 型 WoRDCELL ， 编 写 如 下 程序 。 
(a) 函数 create， 要 返回 指向 WORDCELL 类 型 结构 体 的 指针 。 
(b) 函数 insert (WORDCELL *pWC，int 1ine)， 接受 指 向 WORDCELL 结 构 体 的 指针 以 及 行 号 ， 
在 该 单词 的 出 现 次 数 上 加 1， 而 且 如 果 该 行 未 出 现在 表示 各 行 的 表 中 ， 就 将 其 添加 进去 。 

(2) 重 做 示例 6.17, 假设 长 度 从 1 到 40 的 单词 都 等 可 能 出 现 ， 也 就 是 10% 的 单词 长 度 为 1 至 4，10% 的 为 5 
至 8， 等 等 ， 直 到 10% 的 在 37 到 40 这 个 范围 内 。 如 果 CPC 分 别 为 4、8、…、40， 分 别 平 均 需 要 多 少 
个 字 节 ? 

(3) * 在 示例 6.17 的 模型 中 ， 如 果 从 1 到 nn 的 所 有 单词 长 度 都 等 可 能 出 现 ， 那 么 cPC 为 何 值 (表示 为 n 的 
函数 ) 时 使 用 的 字 节 数 是 最 少 的 ?” 如果 得 不 出 具体 的 答案 ， 也 可 以 用 大 0 近似 值 来 表示 。 

(4)* 使 用 示例 6.18 中 所 示 结 构 体 的 优势 之 一 在 于 , 在 两 个 或 多 个 单词 中 可 以 共享 space 数 组 的 一 些 部 
分 。 例 如 , 在 图 6-36 所 示 的 数组 中 , 有 单词 he 的 word 字 段 等 于 $。 对 单词 al1 、cal1、man、mania、 
maniac、recall、two、woman 进 行 压缩 ， 使 其 在 space 数 组 中 占用 尽 可 能 少 的 元 素 。 通 过 压 
缩 可 以 节省 多 少 空间 ? 

(3)* 另 一 种 存储 单词 的 方法 要 从 space 数 组 中 消除 端 记 号 字符 。 并 且 要 为 示例 6.18 中 的 WORDCELIL 结 
构 体 加 入 length 字 段 ， 从 而 表示 出 在 word 字 段 表 示 的 单词 中 从 第 一 个 字符 起 共有 多 少 个 字符 。 
假设 1ength 字 段 的 整数 要 占用 4 字 节 ， 那 么 这 种 模式 与 示例 6.18 中 的 模式 相 比 ， 是 节省 了 空间 还 
是 更 耗费 空间 ? 如 果 存 储 该 整数 只 需要 1 字 节 呢 ? 

(6) ** 习题 (5) 中 描述 的 方案 也 带 来 了 压缩 space 数 组 的 可 能 。 现在 即便 单词 之 间 没 有 任意 一 方 是 另 
方 的 后 级 ,也 可 以 互相 重 辣 了 。 使 用 习题 (5) 中 的 模式 ,存储 习题 (4) 表 中 的 单词 ,需要 space 数 组 
中 多 少 个 单元 ? 

(7) 编写 程序 ， 接 受 示例 6.18 中 讨论 的 两 个 NORDCELL 结 构 体 ， 并 确定 哪个 结构 体 中 的 单词 在 词典 次 
序 上 先 于 为 一个。 回想 一 下 ， 示 例 6.18 中 单词 都 是 由 * 终 结 的 。 




















6.11 小结 


本 章 涵盖 了 以 下 要 后 。 

口 表 是 一 种 表示 元 素 序 列 的 重要 数据 模型 。 

D 链表 和 数组 是 两 种 可 用 于 实现 表 的 数据 结构 。 

口 表 是 词典 抽象 数据 类 型 的 一 种 简单 实现 ， 不 过 其 效率 无 法 与 第 5 章 中 的 二 又 查找 树 和 第 7 
章 中 的 散 列表 相提并论 。 

口 将 “哨兵 ”放置 在 数组 末尾 ， 从 而 确保 找到 正在 寻找 的 元 素 ， 是 一 种 实用 的 提高 效率 的 
方法 。 
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口 栈 和 队列 都 是 特殊 类 型 的 表 。 

口 栈 是 实现 递归 函数 的 “用 后 瑞 雄 ”。 

D 字符 串 是 表 的 一 种 重要 特例 ， 而 且 有 奉 干 种 特殊 的 数据 结构 可 以 有 效 地 表示 字符 串 ， 其 
中 包括 每 单元 存储 奋 干 字符 的 链表 ， 以 及 由 很 多 字符 串 共享 的 大 型 数组 。 

口 找 出 最 大 公共 子 序列 的 问题 可 以 通过 “动态 规划 ”技术 有 效 地 解决 ， 在 动态 规划 过 程 中 
我 们 会 按照 合适 的 次 序 填 充 信息 表格 。 
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集合 数据 模型 


集合 ( 简称 为 “ 集 ”) 是 最 为 基础 的 数学 数据 模型 。 数 学 中 的 每 种 概念 ， 从 树 到 实数 ， 都 可 
以 表示 为 一 类 特殊 的 集合 。 在 本 书 中 ， 我 们 已 经 见识 过 以 概率 空间 中 事件 的 形式 出 现 的 集 。 词 
典 抽象 数据 类 型 就 是 一 种 集合 ， 可 以 对 其 执行 插入 、 删 除 和 查找 这 些 特殊 操作 。 因 此 ， 说 集合 
也 是 计算 机 科学 中 的 基础 模型 应 该 不 会 让 人 惊讶 。 在 本 章 中 ， 我 们 要 了 解 与 集合 有 关 的 基本 定 
义 ， 并 考虑 有 效 实 现 集合 操作 的 算法 。 





7.1 本 章 主要 内 容 


本 章 将 涵盖 以 下 主题 。 

口 集合 论 的 基本 定义 以 及 集合 的 基本 运算 (7.2 节 和 7.3 节 )。 

口 3 种 最 常用 于 实现 集合 的 数据 结构 : 链表 、 特 征 向 量 和 散 列 表 。 我 们 将 比较 这 些 数据 结构 
在 支持 各 种 集合 运算 时 的 效率 ( 7.4 节 ~ 7.6 节 )。 

口 作为 有 序 对 集合 的 关系 和 困 数 (7.7 节 )。 

口 表示 关系 和 男 数 的 数据 结构 (7.8 节 和 7.9 节 )。 

口 特殊 类 型 的 二 元 关系 ， 如 偏 序 关系 和 等 价 关 系 ( 7.10 市 )。 

口 无 限 集 (7.11 节 )。 





7.2 基本 定义 


在 数学 中 ,术语 “集合 ”是 没有 明确 定义 的 。 就 像 几 何 中 的 “点 ”和 “ 线 ” 那 样 ， 集 合 也 
是 由 其 属性 定义 的 。 具 体 地 说 ， 有 只 适用 于 集合 的 成 员 概 念 。 当 8S 为 集合 ， 而 x 为 任意 事物 时 ， 
我 们 可 以 提出 如 下 间 题 :“x 是 否 为 集合 S 的 成 员 ? ”集合 Ss 就 是 由 所 有 属于 S$ 的 成 员 的 元 素 x 组 成 
的 。 以 下 几 点 总 结 了 与 集合 有 关 的 一 些 重要 概念 。 
(1) 表达 式 xeS 意 味 着 元 素 x 是 集合 S$ 的 成 员 。 
(2) 如 果 xi, x1,…, x 都 是 集合 S 的 成 员 ， 就 可 以 写 为 
S = {0 Xs 
在 这 里 ,每 个 x 都 是 不 同 的 ,在 集合 中 任 一 元 素 都 是 不 能 重复 出 现 的 。 然而, 集合 中 各 
成 员 的 顺序 是 无 关 紧 要 的 。 
(3) 空 集 记 为 名 ， 表 示 没 有 任何 成 员 的 集合 。 也 就 是 说 ， 不 管 * 是 什么 ，xe 都 为 假 。 
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+ 示例 7.1 
设 S={1,3，…, 6}, 也 就 是 说 , S 是 只 含有 整数 成 员 1、3、6 的 集合 。 我 们 可 以 说 1 eS, 3eS 
和 6eS。 不过， 命题 2e $ 为 假 ， 说 其 他 任何 内 容 是 $ 的 成 员 的 命题 也 都 为 假 。 
合 还 能 以 其 他 集合 作为 成 员 。 例 如 ， 设 了 = { 也 分 ,3,C} 。 那 么 7 就 有 3 个 成 员 。 第 一 个 成 











员 是 集合 {1, 2} ， 也 就 是 说 ， 含 有 1 和 2 作为 成 员 的 集合 。 第 二 个 成 员 是 整数 3。 第 三 个 成 员 是 空 
集 。 下 列 命题 是 真 命题 : 册 2} eT, 3e7T, 以 及 @ s7。 不 过 ，1 es 7 为 假 。 也 就 是 说 ，1 是 7 的 成 
员 的 成 员 ， 但 这 不 意味 着 1 是 7 本 身 的 成 员 。 











7.2.1 原子 

在 正式 的 集合 论 中 ， 除 了 集合 别 无 他 物 。 不 过 ， 在 非 正式 的 集合 论 中 ,以 及 在 基于 集合 的 
数据 结构 和 算法 中 ， 可 以 放心 地 假设 存在 茶 些 原子 。 原 子 是 非 集合 元 素 。 原 子 可 以 是 集合 的 成 
员 ， 但 没有 什么 可 以 是 原子 的 成 员 。 说 记 ， 空 集 就 像 原子 那样 是 没有 成 员 的。 不 过 ， 空 集 是 集 














原子 的 类 型 通常 是 很 方便 的 。 因 此 ， 原 子 可 以 是 看 上 去 不 那么 像 “ 原 子 ” 的 结构 体 或 数组 。 





集合 与 表 


虽然 表 的 表示 法 (Xx1, X2,"…, Xi) 与 集合 的 表示 法 {Xx1, X2,…, Xn 非常 相似 ， 但 它们 之 间 存 在 很 
大 区 别 。 首 先 ， 集 合 中 元 素 的 次 序 是 无 关 紧 要 的 。 写 为 {1,2} 的 集合 也 可 以 写作 {2,1}。 相 反 ， 
表 (1,2) 与 表 (2,1) 就 不 是 一 回 事 。 

其 次 ， 表 中 元 素 是 可 以 重复 的 。 例 如 ， 表 (1,2,2) 有 3 个 元 素 ， 第 一 个 是 1， 第 二 个 是 2， 第 
三 个 也 是 2。 集 合生 ,2,2} 是 不 存在 的 。 元素 ( 比如 这 里 的 2 ) 作为 成 员 在 集合 中 出 现 的 次 数 不 能 
超过 一 次 。 上 述 集合 要 有 意义 的 话 ， 它 就 与 {1,2} 或 {2,1} (也 就 是 只 含有 1 和 2 这 两 个 成 员 ， 不 
含 其 他 成 员 的 集合 ) 相同 。 

有 时 候 会 提 到 多 重 集 或 无 序 单位 组 (bag )， 就 是 允许 其 中 元 素 出 现 多 次 的 集合 。 例如， 我 
们 可 以 说 出 现 一 次 1 和 两 次 2 的 多 重 集 。 不 过 多 重 集 与 表 是 不 同 的 ， 因 为 多 重 集 中 的 元 素 也 是 没 
有 次 序 的 。 





7.2.2 ”通过 抽象 对 集合 的 定义 


枚 举 集 合 的 成 员 不 是 定义 集合 的 唯一 方式 。 通常 , 更 方便 的 做 法 是 ,从 某 集合 5 与 元 素 的 某 
属性 P 开 始 ， 人 然后 定义 S 中 具有 属性 P 的 元 素 为 集合 。 这 一 操作 对 应 的 表示 法 称 为 抽 交 ,就 是 
{xixeSH PXY)} 
或 者 说 “5 中 元 素 x 的 集合 都 是 具有 属性 P 的 x”。 
上 述 表达 式 称 为 集合 形成 法 〈set former )。 集 合 形成 法 中 的 变量 x 是 对 应 某 一 表达 式 的 ， 我 
们 也 可 以 用 





Vy eSHPO)} 
来 表示 同一 集合 。 





+ 示例 7.2 
设 S 是 示例 7.1 中 的 集合 和 ,3,6}。 设 PW) 是 属性 “x 为 奇数 "， 则 
{xxeS 昌 x 为 奇数 } 
是 定义 集合 113} 的 另 一 种 方式 。 也 就 是 说 ， 我 们 接受 $ 中 的 元 素 1 和 3 ， 因 为 它们 是 奇数 ， 而 6 不 
是 奇数 ， 所 以 我 们 拒绝 了 它 。 
再 举 个 例子 ， 考 虑 源 自 示例 7.1 的 集合 7={{1,2},3, 人 @)} ， 那 么 
{4|4 eT 昌 4 为 集合 } 
就 表示 集合 {{1,2}, 儿 } 。 
7.2.3 集合 的 相等 性 
一 定 不 能 将 集合 的 实际 组 成 与 其 表示 形式 相 混 淆 。 两 个 集合 相等 ， 也 就 是 说 ， 如 果 它 们 刚 
好 有 相同 的 成 员 ， 那 么 它们 其 实 是 相同 的 集合 。 因 此 ， 大 多 数 集合 有 很 多 不 同 的 表示 方式 ， 包 
括 以 某 种 次 序 直接 枚 举 集合 中 的 元 素 ， 以 及 使 用 抽象 的 表示 。 


+ 示例 7.3 
集合 {L，2} 是 有 且 只 有 1 和 2 这 两 个 成 员 的 集合 。 我 们 可 以 按照 任 一 次 序 表示 这 两 个 元 素 ， 
所 以 {1,2} = {2,1}。 还 有 其 他 很 多 通过 抽象 表示 该 集合 的 方式 ， 例 如 
{xixe {1,2,3}H x<3} 








就 等 于 集合 {1,2}。 
7.2.4 无限 集 


我 们 不 介意 假设 集合 都 是 有 限 的 , 也 就 是 说 , 存在 某 个 整数 n, 使 得 集合 刚好 具有 nn 个 成 员 。 
例如 , 集合 {1,3,6} 具 有 3 个 成 员 。 还 有 一 些 集合 是 无 限 的 , 意味 着 没有 具体 的 整数 能 表示 该 集合 
中 元 素 的 个 数 。 我 们 熟悉 的 无 限 集 包括 下 列 几 种 。 

(1) N， 非 负 整 数 集 。 

(2) Z， 整 数 集 。 

(3) R， 实 数 集 。 

(4) C， 复 数 集 。 

通过 抽象 ， 可 以 根据 这 些 集合 创建 其 他 的 有 限 集 。 


+ 示例 7.4 
集合 形成 法 














{xxeZH x<3} 
表示 由 所 有 人 负 整 数 以 及 0、1 和 2 组 成 的 集合 ， 而 集合 形成 法 
{xxeZH VxeZ)} 
表示 的 是 完全 平方 的 整数 集合 ， 也 就 是 {0,14,9,16,…}。 
再 看 一 个 例子 , 设 P(x) 是 “x 为 质数 ”( 即 之 1 ， 且 x 只 能 被 1 和 它 本 身 整 除 ) 这 一 属性 。 那 
么 质数 集 就 可 以 表示 为 








{xxeNHPOXY)} 
这 一 表达 式 表示 的 是 无 限 集 {2,3,5, 7,11,…}。 
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无 限 集 有 一 些微 妙 而 有 趣 的 属性 我 们 将 在 7.11 节 中 再 来 讨论 这 一 问题 。 


7.2.5 ”习题 


(1) 集合 {{a,bp}，{a} ，{2b,c}} 的 成 员 都 有 哪些 ? 
(2) 写 出 以 下 集合 的 集合 形成 法 表达 式 。 
(a) 大 于 1000 的 整数 集合 。 
(b) 偶 整 数 的 集合 。 
(3) 用 两 种 不 同 的 表示 方式 分 别 表 示 下 列 各 集合 ， 一 种 使 用 抽象 ， 另 一 种 不 使 用 抽象 。 


(a) {a, b, c} 
(b) {0, 1, 5} 








罗素 悖 论 

有 人 也 许 想 知道 ， 为 什么 抽象 操作 要 求 我 们 指明 另 一 个 集合 ， 然 后 必须 从 该 集合 中 选 出 构成 新 集合 

的 元 素 。 为 什么 不 能 直接 使 用 {x| P(x) } 这 样 的 表达 式 ， 例如， 用 
{x 是 蓝 色 的 } 

来 定义 由 所 有 蓝 色 事物 组 成 的 集合 呢 ? 原因 在 于 ， 如 果 用 这 种 概括 方式 来 定义 集合 ， 就 会 让 我 们 陷入 一 
种 由 数学 家 伯 特 兰 ， 罗素 (Bertrand Russell ) 发 现 的 名 为 罗素 悖 论 ( Russell Paradox ) 的 逻辑 矛盾 之 中 。 
我 们 在 听 说 镇 上 的 理发 师 只 给 不 自己 北 胡 子 的 人 剃 胡子 时 ， 就 已 经 接触 到 这 一 悖 论 了 。 如 果 他 给 自己 阐 
胡子 ， 就 不 该 给 自己 北 胡 子 ; 而 如 果 他 不 给 自己 剃 胡子 ， 就 可 以 给 自己 闲 胡 子 。 引 发 这 种 矛盾 的 原因 是 
“只 给 不 自己 亲 胡 子 的 人 剃 胡子 ”这 一 说 法 ， 尽 管 看 起 来 很 合理 ， 但 其 实 是 说 不 通 的 。 

要 理解 罗素 悖 论 是 如 何 关系 到 集合 的 ， 先 假设 可 以 用 flPOo} 的 形式 对 任意 属性 P 定 义 集合 。 接 着 设 属 
性 P(r) 是 “x 不 是 x 的 成 员 ”。 也 就 是 说 , 设 P 属 性 在 集合 x 不 是 其 本 身 成 员 的 情况 下 适用 于 该 集合 。 令 S 为 集合 

5S= {x 不 是 x 的 成 员 } 

现在 问 ，“S 是 否 为 它 本 身 的 成 员 ? ” 

情况 1: 假设 S 不 是 S$ 的 成 员 。 那 么 P(S) 为 真 ，S 就 是 集合 {xx 不 是 x 的 成 员 } 的 成 员 。 不 过 该 集合 就 是 5， 
所 以 通过 假设 S 不 是 它 本 身 的 成 员 , 我 们 证 明了 5S 其实 是 它 本 身 的 成 员 。 因 此 ,不 能 有 S 不 是 它 本 身 成 员 的 
结论 。 

情况 2: 假设 S 是 它 本 身 的 成 员 。 那 么 S 就 不 是 集合 {x 不 是 x 的 成 员 } 的 成 员 。 不 过 该 集合 也 就 是 5， 
这 样 就 得 出 了 S 不 是 它 本 身 成 员 的 结论 。 

因此 ， 当 我 们 假设 P(5) 为 假 时 ， 就 证 明了 它 为 真 ， 而 当 我 们 假设 P(5) 为 真 时 ,我 们 又 证 明了 它 为 假 。 
为 不 管 怎样 都 会 得 出 矛盾 ， 这 样 就 只 能 把 责任 归 和 从 于 这 一 表示 方法 。 也 就 是 说 ， 真 正 的 问题 在 于 按照 
这 样 的 方式 定义 集合 S 是 行 不 通 的 。 

罗素 悖 论 另 一 个 有 趣 的 推论 是 假设 存在 “所 有 元 素 的 集合 "也 是 行 不 通 的 。 如 果 存 在 这 样 的 “全 集 ”， 

比方 说 U， 那么 就 可 以 说 {x Ee U 目 x 不 是 x 的 成 员 } 
而 且 再 次 得 到 了 罗素 悖 论 。 这 样 就 不 得 不 完全 放弃 抽象 。 但 是 抽象 操作 十 分 实用 ， 不 容 放 弃 。 





7.3 集合 的 运算 


有 一 些 操作 集合 的 特殊 运算 ， 比 如 并 集 和 交集 。 大 家 可 能 熟悉 其 中 很 多 运算 ， 但 我 们 在 此 
将 回顾 一 些 最 重要 的 运算 ， 在 下 一 节 中 我 们 将 讨论 这 些 运算 的 一 些 实现 。 


EC 
ot 
六 








7.3.1 并 集 、 交 集 和 差 集 
也 许 结合 集合 最 常用 的 方式 就 是 进行 以 下 3 种 运算 。 
(1) 两 个 集合 S 和 7 的 并 集 ， 记 作 SU 7T， 表 示 含 有 集合 8 或 集合 7 中 或 同 在 二 者 之 中 的 元 素 的 
人 
(2) 两 个 集合 S 和 7 的 交集 ， 记 作 Sm7， 表 示 含 有 同 在 集合 8 和 集合 7 中 的 元 素 的 集合 。 
(3) 两 个 集合 S 和 7 的 差 集 ， 记 作 S 一 7， 表 示 含 有 在 集合 S 中 但 不 在 集合 7 中 的 元 素 的 集合 。 


+ 示例 7.5 

设 S 是 集合 {1,2,3}，7 是 集合 {3,4,5}), 那 么 

SUT =1{1,2,3,4,5} , SNT = £3} ,而 S$ -T={,2}。 
也 就 是 说 ，SU7 包 含 了 出 现在 8 或 7 中 的 所 有 元 素 。 虽 然 3 同 时 出 现在 98 和 7 中 ， 但 是 SU 7 中 当然 
只 能 出 现 一 个 3， 因 为 元 素 在 一 个 集合 中 不 能 出 现 多 次 。SM7T 只 含 3， 因 为 没有 其 他 元 素 同时 出 
现在 S 和 7 中 。 最 后 S - 7 含有 1 和 2， 因 为 这 两 个 元 素 出 现在 S 中 而 未 出 现在 7 中 。 元 素 3 没有 出 现 
在 S 一 7 中 ， 因 为 虽然 它 在 S 中 出 现 了 ,但 它 也 出 现在 7 中 了 。 

当 集 合 S 和 7 是 概率 空间 中 的 事件 时 ， 并 集 、 交 和 集 和 差 集 就 有 了 一 层 含义 。SU7 就 是 $ 发 生 或 
7 发 生 (或 都 发 生 ) 的 事件 。 SN 7 就 是 9g 和 7 部 发 生 的 事件 。8- 7 是 8 发 生 但 7 不 发 生 的 事件 。 不 过 ， 
如 果 5 是 表示 整个 概率 空间 的 集合 ， 那 么 8 - 7 就 是 “7 不 发 生 ” 这 一 事件 ， 也 就 是 7 的 补 集 。 


7.3.2 文 氏 图 


将 涉及 集合 的 运算 看 作 称 为 文 氏 图 ( Venn diagrams ) 的 图 片 通常 是 很 有 用 的 。 图 7-1 中 的 文 
氏 图 表示 S 和 7 这 两 个 集合 ， 它 们 在 图 中 表示 为 两 个 椭圆 。 这 两 个 椭圆 将 整个 平面 分 为 4 个 区 域 ， 
我 们 分 别 用 数字 1 到 4 标记 这 4 个 区 域 。 















































区 域 1 


图 7-1 表示 对 应 基本 集合 运算 的 文 氏 图 的 区 域 


(1) 区 域 1 表 示 既 不 在 S 中 也 不 在 7 中 的 元 素 。 

(2) 区 域 2 表 示 S - 7， 那 些 在 8 中 但 不 在 7 中 的 元 素 。 

(3) 区 域 3 表示 Smn7， 那 些 既 在 $ 中 也 在 7 中 的 元 素 。 

(4) 区 域 4 表 示 7- SS， 那些 在 7 中 但 不 在 $ 中 的 元 素 。 

(5) 区 域 2、3 、4 结 合 在 一 起 表示 SU7， 那 些 在 $ 中 或 在 7 中 ， 或 同 在 二 者 之 中 的 元 素 。 
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代数 是 什么 ? 


可 以 想到 ， 术 语 “ 代 数 ” 指 的 是 解决 单词 问题 , 求 出 多 项 式 的 根 ， 以 及 高 中 代数 课程 中 涵 
盖 的 其 他 问题 。 不 过 ， 对 数学 家 来 说 ， 术 语 “ 代 数 ” 指 的 是 存在 可 用 于 构建 表达 式 的 操作 数 和 
运算 符 的 任 一 种 系统 。 为 了 让 代数 变 得 有 趣 而 实用 ， 通 常会 有 一 些 特殊 常量 和 法 则 ， 让 我 们 可 
以 将 一 个 表达 式 变 形 为 另 一 个 “等 价 的 ”表达 式 。 

最 常见 的 代数 的 操作 数 是 整数 、 实 数 或 是 复数 ， 或 是 表示 这 些 类 型 中 某 一 种 类 型 的 值 的 变 
量 ， 而 运算 符 则 是 普通 算术 运算 符 一 一 加 号 、 减 号 、 乘 号 、 除 号 。 常 数 0 和 1 是 特殊 的 ， 而 且 满 
足 XY+0=xY 这 样 的 法 则 。 在 处 理 算术 表达 式 时 ， 可 以 使 用 诸如 分 配 律 这 样 的 法 则 ， 让 我 们 用 
ax 人 (+c) 这 样 的 等 价 表达 式 来 奉 代 形 如 axp+a+c 的 表达 式 。 请 注意 ， 通 过 这 种 变形 ， 可 以 减 
少 一 次 算术 运算 。 对 表达 式 进 行 这 种 代数 变换 的 目的 通常 是 找 出 与 原 表达 式 等 价 , 但 求 值 所 需 
时 间 更 少 的 表达 式 。 

纵 观 全 书 ， 我 们 会 遇 到 各 种 类 型 的 代数 。8.7 节 介绍 了 关系 代数 ， 是 对 我 们 在 此 讨论 的 集 
合 代数 的 一 般 化 ; 10.5 节 谈论 了 描述 字符 串 模式 的 正则 表达 式 代 数 ; 12.8 节 介绍 了 逻辑 类 型 的 
布尔 代数 。 











尽管 我 们 已 经 说 明了 图 7-1 中 的 区 域 1 具有 有 限 的 范围 ， 不 过 应 该 记 住 的 是 ， 该 区 域 表示 的 
是 S 和 7 之 外 的 一 切 。 因 此 ， 该 区 域 并 非 集合 。 如 果 该 区 域 是 集合 ， 那 么 将 其 与 S 和 7 进行 并 集运 
算 ， 就 会 得 到 “全 集 ”， 而 根据 罗素 悖 论 可 知 这 种 “全 集 ” 是 不 存在 的 。 不 过, 通常 可 以 将 不 在 
文 氏 图 明确 表示 的 任 一 集合 中 的 元 素 画 为 一 个 区 域 ， 就 像 我们 在 图 7-1 中 所 做 的 。 





7.3.3 并 集 、 交 集 和 差 集 的 代 效法 则 


人 们 可 以 仿照 诸如 + 和 * 这 样 的 算术 运算 代数 来 定义 集合 代数 ， 在 集合 代数 中 ， 运 算 符 就 是 
并 集 、 交 集 和 差 集 ,， 而 操作 数 就 是 集合 或 表示 和 集合 的 变量 。 一 旦 可 以 构建 RU((SN7) -只 这 样 的 
复杂 表达 式 ， 就 可 以 询问 两 个 表达 式 是 和 否 等 价 。 也 就 是 说 ， 不 管用 什么 集合 替换 作为 操作 数 的 
变量 ， 它 们 总 是 表示 相同 的 集合 。 通 过 将 一 个 表达 式 蔡 换 为 等 价 的 表达 式 ， 有 时 能 简化 涉及 集 
合 的 表达 式 ， 使 其 能 更 高 效 地 求 值 。 
接 下 来 的 内 容 中 ， 我 们 将 列 出 用 于 并 集 、 交 集 和 差 集 的 最 重要 的 代数 法 则 ， 也 就 是 断言 一 
个 表达 式 与 另 一 个 表达 式 等 价 的 命题 。 符 号 = 用 于 表示 表达 式 的 相等 性 。 
在 多 种 代数 法 则 中 ， 一 方面 是 在 并 集 、 交 集 和 差 集 之 间 有 着 一 种 相似 性 ， 另 一 方面 是 与 整 
数 的 加 法 、 乘 法 和 减法 相似 。 不 过 ， 我 们 将 指出 那些 与 普通 算术 不 存在 相似 性 的 法 则 。 
(a) 并 集 的 交换 律 : (SU7T)=(TUS)。 也 就 是 说 ,在 并 集运 算 中 ， 两 个 集合 中 哪个 出 现在 前 面 
都 是 没关系 的 。 这 一 法 则 成 立 的 原因 很 简单 。 如 果 x 在 5 中, 或 x 在 7 中 , 或 同 在 两 者 之 中 ， 
就 有 元 素 x 在 SU7T 中 。 而 这 正好 就 是 x 在 7 US 中 所 要 满足 的 条 件 。 
(b) 并 集 的 结合 律 : (SU(TUR)) =(SU DUR)。 也 就 是 说 ，3 个 集合 的 并 集 既 可 以 写 为 首先 求 
前 两 个 集合 的 并 集 ， 也 可 以 写 为 首先 求 后 两 个 集合 的 并 集 ， 不 管 哪 种 情况 ， 结 果 都 是 一 
样 的 。 我 们 可 以 像 验 证 交换 律 那样 ， 通 过 论证 当 且 仅 当 元 素 在 右边 的 集合 中 时 才 在 左边 
的 集合 中 ， 从 而 验证 结合 律 。 直 观 的 理由 就 是 两 个 集合 中 含有 的 ， 都 正好 是 那些 出 现在 
S、7 或 R 中 ， 或 任意 两 者 之 中 ， 或 同 在 三 者 之 中 的 那些 元 素 。 
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并 集 的 交换 律 和 结合 律 一 起 告诉 我 们 ,可 以 按照 任意 次 序 为 一 系列 集合 求 并 集 。 结果 总 
是 同一 个 元 素 集合 , 也 就 是 出 现在 需要 求 并 集 的 一 个 或 多 个 集合 中 的 那些 元 素 组 成 的 集 
合 。 这 一 论证 就 像 我 们 在 2.4 节 中 表示 加 法 时 用 到 的 , 而 加 法 运算 中 也 存在 交换 律 和 结合 
律 。 那 时 我 们 证 明 过 用 所 有 方法 组 合 求 和 算式 都 会 得 到 相同 的 结果 。 

(c) 交 集 的 交换 律 : (Sn7 = (TM5)。 直觉 上 讲 , 元 素 x 在 集合 SMT 和 TMS 中 刚好 是 在 相同 的 
情况 下 ， 也 就 是 当 x 在 S 中 而 且 x 在 7 中 时 。 

(d) 交 集 的 结合 律 : (SN(TNR)) = (SNM7DNR)。 直 觉 上 讲 ， 元 素 x 在 所 述 的 这 两 个 集合 中 ， 
刚好 是 当 元 素 x* 同 在 S、7 和 R 这 3 个 集合 中 时 。 就 像 加 法 或 并 集运 算 那 样 ， 对 任意 一 些 集 
合 的 交集 运算 也 可 以 按照 我 们 选择 的 方式 进行 组 合 ， 而 且 结 果 都 是 相同 的 ， 特 别 要 指出 
的 是 ， 结 果 就 是 同时 出 现在 所 有 集合 中 的 那些 元 素 。 

(e) 交集 对 并 集 的 分 配 律 :就 像 我 们 所 了 解 的 乘法 对 加 法 的 分 配 律 , 即 ax(+c)=axp+axc 
那样 ， 法 则 








(SN (TUR)) = (SNDU(SNAR)) 
对 集合 而 言 也 成 立 。 直 觉 上 讲 ， 元 素 x 要 分 别 在 这 两 个 集合 中 ， 刚 好 是 当 x 在 S 中 ,并 且 
至 少 在 7 和 R 其 中 一 个 之 中 时 。 同 样 , 利用 并 集 和 交集 的 交换 律 , 可 以 从 右边 起 分 配 交 集 ， 
就 像 





((TURMS) = (TN)U(RNS)) 
(f) 并 集 对 交集 的 分 配 律 : 同样 ， 
(SU(TNR)) = (SUNDNN(SUR)) 
是 成 立 的。 左右 两 边 都 是 包含 在 S 中 或 同时 在 7 和 R 中 的 元 素 x 的 集合 。 请 注意 ， 将 并 集运 
算 蔡 换 为 加 法 ， 并 将 交集 运算 替代 为 乘法 ， 这 样 形成 的 算术 运算 法 则 为 假 ; 也 就 是 说 ， 
a+bxc 在 一 般 情 况 下 是 不 等 于 (a+5)x(a+c) 的 .这 一 法 则 就 是 集合 运算 与 算术 运算 相似 
性 被 打破 的 情况 之 一 。 就 像 在 (e) 法 则 中 那样 ， 我 们 可 以 利用 并 集 的 交换 律 得 到 等 价 法 则 
((TNR)US) =(T US) N(RUS)) 























+ 示例 7.6 
设 S=41,2,3} ，T={3,4,5} ，R=1{,4,6}。 那 么 
SU(TNR)= {1,2,3}U({3,4,5}N {1,4,6}) 
= {1,2,3}U{4} 
= {1,2,3,4} 
为 一 方面 
(SUT)N(SUR)=({1,2,3}U {3,4,5})N({1,2,3}U1{1,4,6}) 
= {1,2,3,4,5}N {1,2,3,4,6} 
= {1,2,3,4} 
因此 ， 并 集 对 交集 的 分 配 律 在 这 种 情况 下 是 成 立 的 。 当 然 ， 这 并 没有 证 明 这 一 法 则 在 一 般 
情况 下 是 成 立 的 ， 不 过 我 们 在 规则 (中 给 出 的 直觉 论证 应 该 是 有 说 服 力 的 。 
(g) 并 集 和 差 集 的 结合 律 : (S-(T UR)) = ((S-7 -R)。 两 边 所 包含 的 元 素 x， 刚 好 都 是 在 S 中 ， 
而 既 不 在 7 中 ,也 不 在 R 中 。 请 注意 , 这 条 法 则 与 算术 法 则 a 一 (b+c)=(a--5b)-c 是 相似 的 。 
(h) 差 集 对 并 集 的 分 配 律 : ((SU7T) -R) = ((S-7)U(T-R))。 两 边 集 合 中 的 元 素 x， 都 不 在 R 
中 , 但 要 么 在 S 中 ,或 在 7 中 , 或 同 在 S 和 7 两 者 之 中 。 这 一 法 则 在 算术 运算 中 并 没有 相似 
法 则 ，(a+b)-c=(a-c)+(b--c) 是 不 成 立 的 ， 除 非 c = 0。 
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(i) 空 集 是 并 集 的 单位 元 ( identity ): 也 就 是 说 , (SUGg) = 5, 而 根据 并 集 的 交换 律 ,有 (CU 5) 
= S。 粗 略 地 讲 ， 只 有 在 元 素 x 在 S 中 时 ， 它 才 可 能 在 SU 中， 因为 x 不 可 能 在 儿 中 。 
请 注意 ， 交 和 集 是 没有 单位 元 的 。 可 以 想象 一 下 ,包含 “所 有 元 素 ” 的 “集合 ”可 以 作为 
交集 的 单位 元 ， 因 为 集合 S$ 与 该 “集合 ”的 交集 肯定 是 S$。 不 过 ， 正 如 在 介绍 罗素 履 论 时 
提 过 的 ， 不 可 能 存在 “具有 所 有 元 素 的 集合 ”。 

0) 并 集 的 血 等 律 。 将 某 运 算 符 应 用 到 同一 个 值 的 两 个 副本 上 ， 如 果 得 到 的 结果 还 是 该 值 ， 就 
说 该 运算 符 是 才 等 的 。 可 知 有 (SUS) = S。 也 就 是 说 ,在 (SU 5) 中 的 元 素 x, 刚好 也 就 是 在 S 
中 的 元 素 x。 该 法 则 在 算术 运算 中 也 没有 相似 法 则 ， 因 为 ($n 9) = 5 一 般 人 情况 下 不 等 于 a。 

(k) 交 集 的 血 等 律 。 同 样 地 ,我们 有 (SMS) = 5。 

还 有 一 些 与 对 空 集 的 运算 有 关 的 法 则 ， 如 下 所 示 。 

() (S-S) = 

(m) (GS-S)=8, 

(人 ns = 名， 而 且 根 据 交集 的 交换 律 ， 有 (SMB)= 儿 。 


7.3.4 ”利用 文 氏 图 证 明 相 等 性 


图 7-2 用 文 氏 图 表示 了 交集 对 并 集 的 分 配 律 。 该 图 展示 了 3 个 集合 $、T 和 R, 它们 将 平面 分 为 
8 个 区 域 , 分 别 用 数字 1 到 8 标记 。 这 些 区 域 对 应 着 元 素 与 这 3 个 集合 间 8 种 可 能 存在 的 (在 或 不 在 
集合 中 ) 关系 。 
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图 7-2 ”表示 交集 对 并 集 分 配 律 的 文 氏 图 : Sm UR) 由 区 域 3、5 和 6 组 成 ，(S 由)U 
(SNR) 也 是 由 这 些 区 域 组 成 

我 们 可 以 利用 该 图 记录 各 子 表 达 式 的 值 。 例 如 ，7 UR 是 区 域 3、4、5、6、7、8。 因 为 S 是 
区 域 2>、3、5、6， 所 以 SN(T UR) 就 是 区 域 3、5、6。 同样 ，S 中 7 是 区 域 3、6， 而 SNR 是 区 域 5、 
6。 这 样 一 来 ，(S 站 7)U(S 阁 R) 是 同样 的 区 域 3、5、6， 这 就 证 明了 

(SN(CTUR))=((SNT)U(SNR)) 

一 般 来 说 ， 通 过 从 每 个 区 域 考 虑 一 个 具有 代表 性 的 元 素 ， 并 验证 它 要 么 同 在 等 式 两 边 描 述 
的 集合 中 ， 要 么 都 不 在 这 两 个 集合 中 ， 我 们 可 以 证 明 相 等 性 。 这 一 方法 与 我 们 在 第 12 章 中 证 明 
命题 逻辑 的 代数 法 则 时 用 到 的 真 值 表 方 法 是 非常 近似 的 。 


























7.3.5 ”利用 变形 证 明 相 等 性 

另 一 种 证 明 两 个 表达 式 相等 的 方式 ， 是 使 用 我 们 见 过 的 代数 法 则 将 一 个 表达 式 变形 为 另 一 
个 表达 式 。 我 们 将 在 第 12 章 中 更 为 正式 地 讲解 如 何 处 理 表 达 式 ， 现 在 只 要 注意 到 可 以 进行 下 列 
操作 即 可 。 

(1) 用 任 一 表达 式 替 换 相等 关系 中 的 任 一 变量 ， 要 替换 所 有 在 该 相等 关系 中 出 现 的 该 变量 。 
相等 关系 仍然 成 立 。 

(2) 设 B 是 某 相等 关系 中 的 子 表 达 式 , 用 已 知 与 B 等 价 的 表达 式 F 蔡 代 E。 相 等 关系 仍然 成 立 。 

此 外 ， 还 可 以 直接 写 下 任何 表述 为 法 则 的 相等 关系 ， 并 假设 这 种 相等 关系 是 成 立 的 。 


+ 示例 7.7 
我 们 要 证 明 相等 关系 (3S-(SUR))= 纪 。 首 先 使 用 法 则 (g)， 并 集 和 差 集 的 结合 律 ， 也 就 是 
(S-(TUR))= ((S$-7)-—R) 
我 们 用 4 蔡 换 相等 关系 中 出 现 的 两 个 r， 就 得 到 新 的 相等 关系 
(S—(SUR))=((S$-S)—R) 
根据 规则 D，(S-S)= 包 。 因 此 ， 可 以 用 各 蔡 换 上 面 的 (893-S$) ， 得 到 
(S-(SUR))=(g-R) 
用 R 蔡 代 法 则 Gm) 中 的 5S, 就 用 -R= 。 因 此 可 用 名 替换 好-R ,从 而 得 到 (S-(SUR))= 儿 。 


7.3.6 ” 子 集 关系 


集合 间 也 有 一 系列 的 比较 运算 符 ， 它 们 与 数字 间 的 比较 运算 符 相 似 。 如 果 $ 和 7 都 是 集合 ， 
当 S 中 的 各 成 员 也 都 是 7 的 成 员 时 , 就 说 SS 7 。 我 们 可 以 用 多 种 方式 表示 这 种 关系 :“4 是 7 的 子 
集 ”““ 了 7 是 % 的 超 集 ”“$ 包 含 于 了” “7 包含 9”。 

如 果 SS7T ， 而 且 7 中 至 少 有 一 个 元 素 不 是 $ 中 的 成 员 ， 就 说 SC7 。 这 一 关系 可 以 说 成 是 
“3 是 7 的 真子 集 ”" “7 是 $ 的 真 超 集 “4 真 包 含 于 7 、“7 真 包含 ”。 

就 像 “ 小 于 ”关系 那样 ， 也 可 以 反 转 这 种 比较 的 方向 ，8 了 7 等 同 于 TCS ， 而 SS7 等 
同 于 TES 。 


+ 示例 7.8 
以 下 比较 关系 都 是 成 立 的 。 
(1) {1,2} © {1,2,3} 
(Q2) {12} C {1,2,3} 
(3) {1,2} © {1,2} 
请 注意 , 集合 永远 是 自身 的 子 集 , 但 从 不 可 能 是 自身 的 真子 集 , 所 以 1,2} C {1,2} 是 不 成 立 的 。 
还 有 一 些 涉 及 子 集运 算 符 和 我 们 见 过 的 其 他 运算 符 的 代数 法 则 ， 下 面 列 出 了 一 些 。 
(0) ”对 任 一 集合 S,，BSS 
(p) 如 果 SST ， 那么 
() (SUR)=T, 
(着 二 《全 请 
(ii) (S-7)=@。 
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7.3.7 ”通过 证 明 则 包含 关系 对 相等 性 加 以 证 阴 

当 且 仅 当 SS7 且 TSS 时 ， 则 有 两 个 集合 S 和 7 相等 。 因 为 ， 如 果 $ 中 的 每 个 元 素 都 是 7 的 
元 素 ， 而 且 反 之 亦 然 ， 那么 S 和 7 刚好 有 着 相同 的 成 员 ， 因 此 这 两 者 就 是 相等 的 。 反 过 来 讲 ， 如 
果 S 和 T 有 着 相同 的 成 员 ， 那 么 肯定 有 SST 和 7 ES 都 成 立 。 这 一 规则 与 这 样 一 条 算术 规则 类 
似 ， 就 是 当 且 仅 当 a 三 b 和 4b 三 a 都 成 立时 有 a=4。b。 

通过 证 明 某 一 集合 中 的 每 个 元 素 都 包含 在 男 一 个 集合 中 ,可 以 证 明 两 个 表达 式 E 和 的 相等 
性 。 也 就 是 说 ， 我 们 

(1) 考虑 有 中 的 任意 元 素 x， 并 证 明 它 也 在 FF 中， 然后 

(2) 考虑 Ff 中 的 任意 元 素 x， 并 证 明 它 也 在 EZ 中。 
请 注意 ， 要 证 明 E=s， 两 个 方 同 的 证 明 都 是 必要 的 。 


+ 示例 7.9 
现在 来 证 明 并 集 和 差 集 的 结合 律 ， 
(S—-(TUR))=((S—7)—R) 
首先 假设 x 在 左边 的 表达 式 中 ， 一 系列 的 步骤 如 图 7-3 所 示 。 请 注意 ， 在 第 (4 和) 和 第 (3) 步 中 ， 我 们 
反问 使 用 了 并 集 的 定义 。 也 就 是 说 ，(3) 告 诉 我 们 x 不 在 TUR 中 。 如 果 x 在 7 中 ，(3) 就 是 不 对 的 ， 
所 以 可 以 得 出 x 不 在 7 中 的 结论 。 同 样 ，x 不 在 R 中 。 























步 又 





x 在 S-(TUR) 中 给 定 


x 在 5S 中 -的 定义 ， 以 及 (]) 
x 不 在 TUR 中 一 的 定义 ， 以 及 (1) 


x 不 在 7 中 U 的 定义 ， 以 及 (3) 
x 不 在 R 中 U 的 定义 ， 以 及 (3) 
x 在 S-7 中 -的 定义 ， 以 及 (2) 和 (4) 
x 在 (S-7T)-R 中 -的 定义 ， 以 及 (6) 和 (5) 





图 7-3 ”并 和 集 和 差 集 的 结合 律 的 一 半 证 明 


这 还 没完 , 我们 必须 从 假设 x 在 (5-7)-R 中 开始 ， 并 证 明 它 在 S(TUR) 中 。 证 明 步 又 如 图 7-4 
所 示 。 





1) x 在 (S- 刀 - R 中 给 定 

2) x 在 S-7T 中 一 的 定义 ， 以 及 (1) 

3) x 不 在 R 中 一 的 定义 ， 以 及 (1) 

4) x 在 S 中 -的 定义 ， 以 及 (2) 

5) x 不 在 7 中 一 的 定义 ， 以 及 @Q2) 

0) x 不 在 TUR 中 U 的 定义 ， 以 及 (3) 和 (5) 
7) x 在 S-(TUR) 中 的 定义 ， 以 及 (4) 和 (6) 





图 7-4 ”并 集 和 差 集 的 结合 律 的 为 一 半 证 明 
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+ 示例 7.10 

再 举 个 例子 ,证 明 (p) 法 则 的 一 部 分 ， 如 果 SST , 那么 SUR=7 。 首 先 假设 x 在 SUT 中 。 
我 们 根据 并 集 的 定义 可 知 ， 只 可 能 存在 下 列 情况 之 一 

(1) x 在 S$ 中 ; 

(2) x 在 7 中 。 

在 情况 (1) 中 ， 因 为 假设 有 SS7T , 所 以 可 知 x 在 7 中 。 在 情况 (2) 中 ， 直接 就 可 以 看 出 x 在 7 中 。 
因此 ， 在 任 一 情况 下 x 都 在 7 中 ， 这 样 就 完成 了 证 明 的 第 一 半 一 一 命题 (SUT)S7 。 

再 来 假设 x 在 7 中 。 那 么 根据 并 集 的 定义 就 有 x 在 SUT 中 。 因 此 ，7T 5S (SU7T) ， 这 就 是 证 明 
的 第 二 半 。 这 样 就 可 以 得 出 ， 如 果 SS7T ,那么 SUT=7。 


7.3.8 集合 的 震 集 


如 果 S 是 任 一 集合 ， 那 么 S 的 乔 集 就 是 指 由 S$ 的 所 有 子 集 组 成 的 集合 。 我 们 将 用 P(5) 表 示 S 的 
震 集 ， 虽 然 有 时 也 会 使 用 2 这样 的 表示 法 。 


+ 示例 7.11 

设 S=1{,2,3}。 那 么 

P(S) = {©, {0},{2},{3},{1,2},{1,3},{2,3},{1,2,3}} 

也 就 是 说 ，P(5) 是 含有 8 个 成 员 的 集合 ， 每 个 成 员 本 身 都 是 一 个 集合 。 空 集 也 在 P(5) 中 ， 因 为 显 
然 有 名 SS 。 单 元 素 集 一 一 由 5S 中 的 一 个 元 素 构 成 的 集合 ， 即 {}、 和 人}、{3} 一 一 也 在 P(5) 中 。 同 
样 ， 从 3 个 成 员 中 任 选 两 个 组 成 的 3 个 集合 在 P(5) 中 ， 而 S 本 映 也 是 P(5) 的 成 员 。 

再 举 一 个 例子 ，P( 名 = {名 } 因 为 SSS， 而 除 空 集 之 外 ,没有 任何 集合 S 可 以 满足 SSG。 
请 注意 ，{ C } 是 包含 空 集 的 集合 , 它 和 空 集 是 不 一 样 的 。 特别 要 指出 的 是 ，{ 名 } 含 有 一 个 成 员 ， 
也 就 是 名 ， 而 空 集 是 不 含 任何 成 员 的 。 


7.3.9 ” 突 集 的 大 小 


如 果 S 有 nn 个 成 员 ， 那 么 P(S) 有 > 个 成 员 。 在 示例 7.11 中 ， 我们 看 到 有 3 个 成 员 的 集合 的 容 集 
共有 2 = 8 个 成 员 。 此 外 ，2"= 1， 而 且 我 们 看 到 ， 包 含 0 个 元 素 的 空 集 的 寡 集 刚好 有 1 个 元 素 。 

设 S= {a,a,,…,a,} ， 其 中 a,a,,…,a, 是 任意 n 个 元 素 。 现 在 要 通过 对 n 的 归纳 证 明 ，P(5) 有 
2 个 成 员 。 

依据 。 如 果 n=0， 那 么 S 就 是 名。 我 们 之 前 已 经 得 出 P( 儿 ) 有 一 个 成 员 的 结论 。 因 为 2"- 1 ， 
所 以 我 们 证 明了 依据 情况 。 

归纳 。 假 设 当 5 = {a ,a,…,a,} 时 ，P(5) 有 2" 个 成 员 。 设 qi 是 一 个 不 同 于 S 中 任 一 元 素 的 新 
元 素 ， 并 设 7=SUt{a,,}， 该 集合 是 个 具有 n+1 个 元 素 的 集合 。 现 在 ，7 的 子 集 要 么 合 有 a 这 
一 成 员 ， 要 么 不 含 这 一 成 员 。 我 们 来 依次 考虑 这 两 种 情况 。 

(1) 不 包含 ci 的 7 的 子 集 ， 也 是 $ 的 子 集 ， 因 此 在 PC 中。 而 根据 归纳 假设 ， 正 好 有 2" 个 这 
样 的 集合 。 

(2) 如 果 R 是 包含 co 的 7 的 子 集 , 设 0=R-{aw}， 也 就 是 说 ，O 是 将 gl 删除 后 的 R。 那么 O 
是 S 的 子 集 。 根 据 归纳 假设 ,刚好 有 >" 个 可 能 存在 的 集合 O， 而 每 一 个 都 与 唯一 的 集合 R ( 也 就 
是 OUfe  ) 对 应 。 
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我 们 得 出 7 刚好 有 2 x 2"， 也 就 是 2” 个 子 集 ， 其 中 有 一 半 也 是 $ 的 子 集 ， 而 另 一 半 则 是 由 $ 
的 各 子 集 分 别 加 上 新 元 素 aril 形 成 的 。 因 此 ,归纳 步骤 得 到 证 明 , 给 定 任 一 具有 7 个 元 素 的 集合 $ 
都 有 2" 个 子 集 的 条 件 ， 就 证 明了 具有 n+1 个 元 素 的 任 一 集合 7 都 有 2” 个 子 集 。 


7.3.10 “习题 


(1) 在 图 7-2 中 ,我 们 证 明了 两 个 表达 式 对 应 着 区 域 集合 {3,5,6}。 不 过 ,每 个 区 域 都 可 以 表示 为 涉及 S、 
T 和 R， 以 及 并 集 、 交 和 集 和 差 集运 算 符 的 表达 式 。 写 出 对 应 以 下 各 区 域 的 两 种 不 同 的 表达 式 。 

(a) 区 域 6。 
(b) 区 域 2 和 区 域 8。 
(c) 区 域 2>、 区 域 4 和 区 域 8。 

(2) 使 用 文 氏 图 证 明 以 下 代数 法 则 。 对 于 相等 关系 中 涉及 的 每 个 子 表达 式 , 指出 它 所 表示 的 区 域 集合 。 

(a) (SU(TNR))=((SUT)N(GS UR)) 
(b) (SUT)-R)=((S-R)U(T-R)) 
(c) (S-(TUR))=((S-7)-R) 

(3) 通过 证 明 每 一 边 对 男 一 边 的 包含 关系 ， 证 明 习 题 (2) 中 的 各 相等 关系 。 

(4) 假设 SS7T ,通过 证 明 两 边 互 为 男 一 边 的 子 集 ， 证明 如 下 相等 关系 : 
(a) (SUT)=S 
(b) ( -站 = 他 

(5)* 假设 没有 集合 是 其 他 集合 的 子 集 , 那么 包含 n 个 集合 的 文 氏 图 可 将 平面 分 割 成 多 少 个 区 域 ? 假设 
1 个 集合 中 有 一 个 是 另 一 个 的 子 集 , 但 没有 其 他 的 包含 关系 。 那么 有 些 区 域 就 将 是 空 的 。 例 如, 在 
图 7-1 中 ， 如 果 SS7T ,那么 区 域 2 就 将 为 空 ， 因 为 没有 在 S 中 而 不 在 7 中 的 元 素 。 一 般 而 言 ， 共 有 
多 少 个 非 空 区 域 ? 

(6) 证 明 ， 如 果 SST ,那么 P(S)JS P(7) 。 

(7) * 在 C 语 言 中 ， 我 们 可 以 用 元 素 为 链表 表 头 的 链表 来 表示 成 员 为 集合 的 集合 y， 这 些 元 素 对 应 的 链 
表 都 表示 Ss 的 成员 之 一 。 编 写 C 语 言 程 序 ， 接受 表示 集合 的 元 素 构 成 的 表 ， 即 表 中 元 素 各 不 相同 的 
表 , 并 返回 给 定 集合 的 窜 集 。 大 家 编写 的 程序 的 运行 时 间 是 多 少 ? 提示 : 利用 对 “ 含 n 个 元 素 的 集 
合 的 容 集 中 有 >" 个 成 员 ” 这 一 命题 的 归纳 证 明 ， 得 出 创建 知 集 的 递归 算法 。 如 果 脑 筋 灵活 点 ， 就 
会 使 用 同一 个 表 作 为 若干 集合 的 相同 部 分 , 从 而 避免 复制 表示 窜 集 成 员 的 表 , 这 样 既 能 市 省 时 间 ， 
又 能 市 省 空间 。 

(8) 证 明 
(a) P(S)UP(T) SE P(SUT) 

(b) P(SNT)E P(S)N PT) 
如 果 将 这 里 的 包含 关系 替换 为 相等 关系 ， 那 (a) 或 (b) 是 否 还 成 立 ? 

(9) P(P(P(C))) 是 什么 ? 

(10)* 如 果 从 名 开始 ,应 用 圭 集 运算 符 z 次 ,那么 得 到 的 集合 中 有 多 少 个 成 员 ? 例如 ,习题 (9) 就 是 n=3 
的 情况 。 















































7.4 集合 的 链表 实现 


我 们 已 经 在 6.4 节 中 看 到 过 如 何 用 链表 数据 结构 实现 词典 操作 播 入 、 删 除 和 查找 。 同 时 还 看 
到 ， 如 果 集 合 有 7z 个 元 素 ， 那 么 这 些 操作 的 期 望 运 行 时 间 都 是 O(n) 。 这 一 运行 时 间 不 如 5.8 节 中 
使 用 平衡 二 又 查 找 树 实 现 词 典 操 作 平均 为 O(logn) 的 运行 时 间 那 样 理想 。 男 一 方面 ， 正 如 在 7.6 
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节 中 将 要 看 到 的 ， 用 来 表示 词典 的 散 列表 数据 结构 是 以 词典 的 链表 表示 为 基础 的 ， 而 它 一 般 要 
比 二 又 查找 树 快 。 
7.4.1 并 集 、 交 集 和 差 集 
尽管 具体 技巧 与 我 们 应 用 在 词典 操作 上 的 有 所 不 同 ， 但 使 用 链表 数据 结构 还 是 对 诸如 并 集 
这 样 的 基本 集合 运算 有 利 的 。 特 别 要 说 明 的 是 ， 为 表 排 序 可 以 显著 改善 并 集 、 交 集 和 差 集运 算 
的 运行 时 间 。 而 我 们 在 6.4 节 中 看 到 的 ， 排 序 只 能 对 词典 操作 的 运行 时 间 带 来 比较 小 的 改善 。 
首先 ， 看 看 在 用 未 排序 表 表 示 集 合 时 会 出 现 什 么 问题 。 在 这 种 情况 下 ， 要 对 大 小 分 别 为 n 
和 m 的 集合 进行 并 集 、 交 集 或 差 集运 算 ， 就 需要 O(mn) 的 时 间 。 例如， 要 创建 表示 集合 5 与 集合 
7 的 并 集 的 表 U， 首 先 要 将 表示 5 的 表 复制 到 一 开始 为 空 表 的 U 中 。 然 后 对 7 中 的 各 个 元 素 加 以 检 
验 ， 看 看 它们 是 否 也 在 S$ 中。 如果 不 在 ， 就 将 该 元 素 添加 到 U 中 。 图 7-5 简 要 描述 了 这 一 思路 。 
































) copy 9 to Li 

) for (each x in 7) 
) 

) 


if (!lookup(z, 5S)) 
insert(x, U); 





| 
(2 
后 
(4 
图 7-5 ”为 用 未 排序 表 表 示 的 集合 求 并 集 的 伪 代 码 概 要 


假设 S 含 有 n 个 成 员 ， 而 7 含有 mm 个 成 员 。 那 么 第 (1) 行 将 5S 复制 到 上 U 中 的 操作 可 以 在 O(n) 时 间 
内 完成 。 如 果 从 第 (3) 行 得 知 x 不 在 S 中 ,那么 只 要 执行 第 (4) 行 的 插入 即 可 。 因 为 x 只 可 以 在 表示 7 
的 表 中 出 现 一 次 ， 所 以 可 知 x 还 不 在 U0 中。 因此 ,将 x 放 在 表示 UU 的 表 的 前 端 是 没 问题 的 ， 并且 第 
(4) 行 可 以 在 0() 时 间 内 完成 。 第 (2) 行 至 第 (4) 行 的 for 循 环 要 人 迭代 ma 次， 而 且 其 循环 体 要 花费 
O(n) 的 时 间 。 因 此 ， 第 (2) 行 至 第 (4) 行 的 运行 时 间 就 是 O(mn) ， 它 主导 了 第 () 行 的 OCo) 时 间 。 

还 有 与 之 类 似 的 实现 交集 和 差 集运 算 的 算法 ， 所 花 的 时 间 也 都 是 O(mn) 。 我 们 在 此 将 这 些 
算法 留 给 读者 来 设计 。 


7.4.2 ”使 用 已 排序 表 的 并 集 、 交 集 和 差 集 


当 表 示 集 合 的 表 已 经 排序 时 ,执行 并 集 、 交 集 和 差 集运 算 就 要 快 得 多 。 其 实 ， 大 家 会 发 现 ， 
即便 这 些 表 一 开始 没有 排 过 序 ， 在 执行 这 些 集合 运算 之 前 先 给 表 排 序 都 是 值得 的 。 人 例如， 考虑 
一 下 SUT 的 计算 ,其 中 S 和 7 者 是 用 已 排序 表 表 示 的 。 这 一 过 程 就 和 2.8 节 的 归并 算法 类 似 。 区 
别 之 一 在 于 , 在 当前 位 于 两 表 开 头 位 置 的 最 小 元 素 相 同时 ， 只 需要 给 出 该 元 素 的 一 个 副本 即 可 ， 
而 不 用 像 归 并 那样 必须 给 出 两 个 副本 。 另 一 个 区 别 在 于 ， 我 们 不 能 从 表示 用 来 求 并 集 的 集合 S 
和 7 的 表 中 直接 删除 元 素 ， 因 为 不 应 该 在 构建 S 和 7 的 并 集 时 对 5 或 7 造成 破坏 。 我 们 必须 为 所 有 
元 素 创 建 副 本 ， 用 以 形成 二 者 的 并 集 。 

假设 类 型 LIST 和 CELL 是 像 之 前 那样 ， 通 过 宏 

DefCell(int, CELL, LIST); 

定义 的 。 函 数 setUnion 如 图 7-6 所 示 。 在 第 (1) 行 要 利用 辅助 函数 assemble(x, L, M) 创 建 一 
个 新 单元 , 在 第 (2) 行 将 元 素 x 放 入 该 单元 , 并 在 第 (3) 行 调用 setUnion 求 表 L 和 M 的 并 集 。 然 后 ， 
assemble 会 返回 对 应 x 的 单元 ， 后 面 跟着 对 L 和 M 应 用 setunion 后 得 到 的 表 。 请 注意 ， 
assemble 和 setUnion 这 两 个 水 数 是 相互 递归 的 ， 每 一 个 都 会 调用 为 一 个 。 

国 数 setUnion 会 从 两 个 给 定 的 已 排序 表 中 选 出 最 小 的 元 素 ， 并 将 选 定 的 元 素 与 两 个 表 其 
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余 的 部 分 一 起 传 给 assemble。 对 setUnion 来 说 有 6 种 情况 ， 具 体 取 决 于 两 个 表 中 有 没有 一 个 
为 NULL， 如 果 没 有 ， 就 要 看 两 个 表 中 哪个 表 表 头 位 置 的 元 素 先 于 另 一 个 。 

(1) 如 果 两 个 表 都 为 NULL，setUnion 就 直接 返回 NULL ， 结 束 递 归 过 程 。 这 种 情况 就 是 图 
7-6 中 的 第 (5) 行 和 第 (6) 行 。 

(2) 如 果 Z 为 NULL 而 WM 不 是 , 那么 在 第 (7) 行 和 第 (8) 行 , 通过 从 MM 中 取出 第 一 个 元 素 , 后 面 跟 
上 NULL 表 与 MM 尾部 的 “并 集 ”, 就 组 成 了 这 两 个 表 的 并 集 。 请 注意 , 在 这 种 情况 下 , 对 setUnion 
的 成 功 调用 会 使 M 被 复制 下 来 。 

(3) 如 果 M 为 NULL 而 ZL 不 是 ， 那 么 在 第 (9) 行 和 第 (10) 行 ， 要 完成 的 工作 是 相反 的 ， 用 ZL 的 第 
一 个 元 素 合 L 的 尾部 组 成 答案 。 

(4) 如 果 L 和 MM 的 第 一 个 元 素 是 相同 的 ， 那 么 在 第 (11) 行 和 第 (12) 行 ， 就 创建 该 元 素 的 一 个 副 
本 ， 表 示 为 L->element ， 加 上 Z 的 尾部 和 M 的 尾部 ， 一 起 构成 答案 。 

(5) 如 果 Z 的 第 一 个 元 素 先 于 M， 那 么 在 第 (13) 行 和 第 (14) 行 ,我们 会 用 该 最 小 元 素 ,，Z 的 尾 
部 ， 以 及 整个 表 M 一 起 组 成 答案 。 

(6) 对 称 地 ， 在 第 (15) 行 和 第 (16) 行 ， 如 果 最 小 元 素 在 M 中 ， 我 们 就 用 该 元 素 、 整 个 表 L， 以 
及 M 的 尾部 组 成 答案 。 














LIST setUnion(LIST L, LIST M); 
LIST assemble(int x, LIST L, LIST M) ; 


/* 由 assemble 函数 生成 的 表 ， 其 表 头 元 素 为 x 上 且 
尾部 为 表 工 和 表 M 并 集中 所 含 元 素 */ 


LIST assemble(int x, LIST L, LIST M) 
{ 
LIST first; 


(1) first = (LIST) malloc(sizeof (struct CELL) ) ; 
(2) first->element = Xx; 

(3) first->next = setUnion(L, M); 

(4) return first; 


} 
/* setUnion 返回 的 表 是 工 和 M 的 并 集 */ 


LIST setUnion(LIST L, LIST M) 
{ 

(5) if (L == NULL && M == NULL) 

(6) return NULL ; 

(7) else if (L == NULL) /* M 在 这 里 不 能 为 NULL */ 

(8) 

(9) 

10) 





return assemble(M->element, NULL, M->next):; 
else if (M == NULL) /* 了 在 这 里 不 能 为 NULL */ 
return asSsemble(L->element ，L->next ，NULL) ; 
/* 如 果 到 了 这 里 ，L 和 M 都 不 能 为 NULL */ 
) else if (L->element == M->element) 
) return assemble(L->element, L->next, M->next); 
) else if (L->element < M->element) 
) 
) 
) 











return assemble(L->element, L->next, M); 
else /* 这 里 有 M->element < L->element */ 
return assemble(M->element, L, M->next); 








图 7-6 ”为 用 已 排序 表 表 示 的 集合 计算 并 集 
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+ 示例 7.12 

假设 集合 S 是 {1,3,6}, 7 是 {5,3}。 表示 这 两 个 集合 的 已 排序 表 分 别 是 L=(1,3,6) 和 M = (3,5) 。 
调用 setUnion (L,M) 求 并 集 。 因 为 L 的 第 一 个 元 素 是 1， 先 于 M 的 第 一 个 元 素 3， 所 以 情况 (5) 适 
用 , 因此 我 们 用 1, ZL 的 尾部 , 称 其 为 L1=(3,6), 以 及 M 组 成 要 计算 的 并 集 。 函数 assemble (1,L,M) 
会 在 第 (3) 行 调用 setUnion (L,M) ， 结 果 就 是 第 一 个 元 素 1 与 等 于 并 集 的 尾部 组 成 的 表 。 

对 setUnion 的 这 一 调用 是 情况 (4)， 也 就 是 两 个 开头 元 素 相 等 的 情况 ， 这 里 都 是 3。 因 此 ， 
我 们 用 元 素 3 的 一 个 副本 ， 加 上 万 的 尾部 和 M 的 尾部 ,组 成 要 计算 的 并 集 。 这 些 尾部 分 别 是 只 有 
元 素 6 组 成 的 L,， 以 及 只 由 元 素 5 组 成 的 M1。 接 下 来 的 调用 是 setuUnion (L,,M)， 这 是 情况 (6) 的 
实例 。 因 此 我 们 将 5 加 到 并 集中 ， 并 调用 setunion (L,,NULL) 。 这 是 情况 (3)， 为 并 集 生成 6， 并 
调用 setUnion (NULL,NULL)。 这 里 就 遇 到 了 情况 (1)， 递归 就 终止 了 。 对 setUnion 首 次 调用 的 
结果 就 是 表 (1,3,5,6)。 图 7-7 详 细 展 示 了 这 一 套 示 例 数 据 产生 的 调用 与 返回 。 








调用 setUnion ((1,3, 6), (3,5)) 
调用 assemble (1, (3， 6)， (3， 5)) 
调用 setUnion ((3， 6), (3, 5)) 
调用 assemble (3, (6), (5)) 
调用 setUnion((6)， (5)) 
调用 assemble 人 (6), NULL) 
调用 setUnion ((6), NULL) 
调用 assemble (6, NULL, NULL) 
调用 setUnion (NULL, NULL) 
返回 NULL 
返回 (6) 
返回 (6) 
返回 (5,6) 
二 可 位 
返回 (3,5,6) 
返回 (3,5,6) 
返回 (1,3,5,6) 
返回 (1,3,5,6) 











图 7-7 示例 7.12 对 应 的 调用 合 返 回 序列 


请 注意 ，setUnion 生 成 的 表 总 是 已 排序 的 。 通 过 看 到 哪 种 情况 适用 ， 可 以 知道 该 算法 为 
何 起 作用 ， 表 7 或 W 中 的 各 元 素 ， 要 么 通过 成 为 对 assemble 调 用 中 的 第 一 个 参数 ， 从 而 被 复制 
到 输出 中 ， 要 么 留 在 作为 参数 被 传递 给 对 setUnion 的 递归 调用 的 表 中 。 

7.4.3 并 集运 算 的 运行 时 间 

如 果 对 分 别 具 有 7 个 和 六 个 元 素 的 集合 调用 setUnion， 那 么 setUnion 所 花 的 时 间 就 是 
Ol(m+n) 。 想 明白 为 什么 ， 要 注意 到 对 assemble 的 调用 会 花 00) 的 时 间 为 输出 表 创 建 一 个 单 
元 , 然后 对 剩 下 的 表 调 用 setUnion。 因此 , 图 7-6 中 对 assemble 的 调用 , 可 以 视 为 要 花 OU) 的 
时 间 ， 再 加 上 对 长 度 之 和 为 比 L 和 MM 长 度 之 和 少 1， 或 在 情况 (4) 下 比 L 和 以 长度 之 和 少 2 的 两 个 表 
调用 setUnion 所 花 的 时 间 。 此 外 ，setUnion 中 的 所 有 工作 ， 除 了 对 assemble 的 调用 之 外 ， 
所 花 时 间 都 是 0() 。 
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多 变量 函数 的 大 O 
正如 在 6.9 节 中 指出 的 ， 我 们 为 单 变量 函数 定义 的 大 0 概念 自然 也 可 以 应 用 于 多 变量 函数 。 
如 果 存 在 常数 c 和 al、…、ax, 使 得 对 i=1、…、k， 只 要 x 之 a,, 就 有 f(x,…,X,) 太 cg(X,…,X)， 
就 说 了 (Xi,…,Xi) 是 O(g(xi,…,X))。 特 别 要 说 的 是 ,虽然 当 m 和 nn 其 中 一 个 为 0 而 另 一 个 大 于 0 时 
会 有 m+n 大 于 mn， 但 通过 选择 常数 c、al 和 a 都 等 于 1]， 仍然 可 以 说 m+n 是 O(mn)。 





接 下 来 ,在 总 长 度 为 m+n 的 两 个 表 调 用 setuUnion， 这 最 多 会 造成 m+n 次 对 setUnion 的 递 
归 调 用 ， 以 及 同样 次 数 的 对 assemble 的 调用 。 除 去 递归 调用 花 的 时 间 ， 每 次 调用 所 花 的 时 间 
为 0()。 因 此 ， 求 并 集 所 花 的 时 间 为 O(m+n) ， 也 就 是 说 ， 与 两 个 集合 的 大 小 之 和 成 比例 。 

这 一 时 间 比 为 用 未 排序 表 表 示 的 集合 求 并 集 所 需 的 时 间 O(mn) 要 少 。 其 实 ， 如 果 表 示 和 集合 
的 表 是 未 排序 的 ,可 以 在 O(nlogn+mlogm) 的 时 间 内 为 这 两 个 表 排序 ,接着 再 对 已 排序 的 表 求 
并 集 。 因 为 nlogn 主导 了 n, 而 mlogm 主导 了 m,， 所 以 可 以 将 排序 与 求 并 集 的 总 时 间 支 出 表示 为 
O(nlogn+mlogm) 。 这 一 表达 式 可 能 比 O(mn) 大 , 但 只 要 n 与 m 的 值 很 接近 ,也 就 是 说 ， 只 要 两 
个 集合 的 大 小 近似 相同 ， 它 就 比 O(mn) 小 。 因 此 ， 在 求 并 集 之 前 先 排序 是 说 得 通 的 。 


7.4.4 交集 和 差 集 


图 7-6 概 述 了 求 并 集 的 算法 思路 , 这 一 思路 也 适用 于 求 交 集 和 差 集 的 运算 : 当 集合 用 已 排序 
表 表 示 时 ， 交 集 和 差 集运 算 也 能 以 线性 时 间 执 行 。 对 交集 而 言 ， 只 有 当 元 素 同 时 出 现在 两 个 集 
合 中 , 也 就 是 像 之 前 的 情况 (4) 那 样 时 ， 才 会 把 元 素 复 制 到 输出 中 。 如 果 有 一 个 表 为 NULL ， 在 交 
集中 就 不 会 有 任何 元 素 了 ， 因 此 情况 (D)、C)、(3) 就 可 以 被 蔡 换 为 返回 NULL 的 操作 。 在 情况 (4) 
中 ,我们 将 两 个 表 表 头 的 元 素 复 制 到 交集 中 。 而 在 情况 (3) 和 情况 (6) 中 ， 两 个 表 的 表 头 元 素 是 不 
同 的 ， 这 样 较 小 的 元 素 就 不 可 能 都 出 现在 两 个 表 中 ， 因 此 就 不 用 癌 交 集中 添加 任何 内 容 ， 而 是 
要 将 较 小 的 元 素 从 其 所 在 表 中 弹出 ， 并 对 剩 下 部 分 求 交 集 。 

想 知道 为 什么 这 样 能 行 ， 可 以 举 个 例子 ,假设 x 是 在 表 Z 的 表 头 ，2 是 在 表 M 的 表 头 ， 并 且 有 
a<=b。 那么 a 就 不 可 能 出 现在 已 排序 表 M 中 ,因此 可 以 排除 qa 同 时 出 现在 两 个 表 中 的 可 能 。 不 过 ， 
5 可 能 出 现在 表 Z 中 在 ao 之 后 的 某 个 位 置 ， 这 样 一 来 就 仍然 有 可 能 用 到 来 自 M 的 2。 因 此， 我 们 需 
要 继续 对 LL 的 尾部 与 整个 表 M 求 交集 。 相 反 ， 如 果 b 小 于 a， 就 要 对 整个 表 L 与 M 的 尾部 求 交 集 。 
计算 交集 的 C 语 言 代 码 如 图 7-8 所 示 。 还 需要 修改 assemble， 用 对 intersection 的 调用 替代 
对 setUnion 的 调用 。 我 们 将 这 一 修改 以 及 为 已 排序 表 求 差 集 的 程序 留 作 本 节 习 题 。 


LIST intersection(LIST L, LIST M) 
{ 





























if (L == NULL || M == NULL) 
return NULL ; 
else if (L->element == M->element) 
return assemble(L->element, L->next, M->next):; 
else if (L->element < M->element) 
return intersection(L->next, M); 
else /* 这 里 有 M->element < L->element */ 
return intersection(L, M->next); 








图 7-8 ”为 用 已 排序 表 表 示 的 集合 计算 交集 ， 这 里 需要 新 版 本 的 assemble 靖 数 
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7.4.5 ”习题 


(1) 编写 C 语 言 程序 ， 为 用 未 排序 表 表示 的 集合 求 (a) 并 集 ; (b) 交 集 ; (c) 差 集 。 

(2) 修改 图 7-6 中 的 程序 ， 使 其 为 用 已 排序 表 表示 的 集合 求 (a) 交 集 ; (b) 差 集 。 

(3) 图 7-6 中 的 assemble 和 setUnion 函 数 不 会 改变 原来 的 表 ， 也 就 是 说 ， 它 们 会 创建 元 素 的 副本 ， 
而 非 使 用 给 定 表 本 身 的 单元 。 大 家 能 和 否 通过 在 求 并 集 的 过 程 中 销毁 给 定 的 表 来 简化 程序 ? 

(4) * 通过 对 作为 参数 给 定 的 两 个 表 的 长 度 之 和 进行 归纳 ， 证 明 图 7-6 中 的 setUnion 函 数 会 返回 给 定 
表 的 并 集 。 

(5)* 两 个 集合 S 和 7 的 对 称 差 是 (5S 一 7T)U(T -5S) ,也 就 是 说 ,刚好 只 出 现在 5 或 7 其 中 一 个 之 中 的 元 素 。 
编写 程序 ,为 用 已 排序 表 表示 的 两 个 集合 求 对 称 差 。 大 家 的 程序 应 该 像 图 7-6 中 那样 只 传递 一 次 表 ， 
而 不 要 调用 求 并 集 与 求 差 集 的 程序 。 

(6) * 我 们 对 图 7-6 中 的 程序 进行 了 非 正式 的 分 析 ， 论 证 了 如 果 两 个 表 的 总 长 度 为 x7， 就 会 有 O(n) 次 对 
setUnion 和 assemble 的 调用 ， 而 且 每 次 调用 花 的 时 间 是 0() 加 上 递归 调用 所 花 的 时 间 。 我 们 
可 以 将 这 一 论证 过 程 正式 化 ,， 设 T(n) 是 setUnion 对 总 长 度 为 n 的 两 个 表 的 运行 时 间 ，7,(n) 是 
assemble 对 总 长 度 为 n 的 两 个 表 的 运行 时 间 。 分 别 写 出 ZT 与 7 相互 以 对 方 定 义 自 身 的 递归 规则 。 
进行 替换 ， 消 去 也 ， 为 建立 常规 的 递 推 关系 。 为 该 递 推 关 系 求解 。 这 是 否 证 明了 setUnion 
所 花 时 间 为 O(n)? 








7.5 ”集合 的 特征 向量 实现 


很 多 时 候 , 我 们 遇 到 的 一 些 集 合 是 要 称 为 “全 集 ” "的 某 个 小 集合 U 的 各 子 集 。 例 如 ,扑克 
牌 型 就 是 由 全 部 52 张 扑克 有 牌 组 成 的 集合 的 子 集 。 当 我 们 关注 的 集合 是 某 个 小 集合 U 的 各 子 集 时 ， 
存在 一 种 比 7.4 节 中 讨论 的 表 实 现 有 效 得 多 的 集合 实现 方式 。 我 们 以 某 种 方式 为 C 中 的 元 素 排 定 
次 序 ， 这 样 一 来 ，U 中 的 每 个 元 素 都 可 以 与 一 个 唯一 的 “位 置 ” 相 关联 ， 这 一 位 置 是 从 0 到 -1 
的 整数 ， 其 中 n 是 U 中 元 素 的 个 数 。 

接着 ,给 定 一 个 包含 于 U 的 集合 S$, 就 可 以 用 由 0 和 1 组 成 的 特征 向 量 表示 S， 其 规则 是 ,对 U 
中 的 每 个 元 素 x， 如 果 x 在 S 中 ， 对 应 x 的 位 置 上 就 是 1， 而 如 果 x 不 在 S 中 ， 对 应 的 位 置 上 就 是 0。 


+ 示例 7.13 
设 U 是 一 副 扑 克 有 牌 组 成 的 集合 。 我 们 可 以 用 任何 方式 为 扑克 有 牌 排 定 次 序 ， 不 过 比较 合理 的 
模式 是 先 按照 它们 的 花色 : 梅花 、 方 块 、 红 桃 和 黑 桃 。 然 后, 在 同一 花色 中 , 按照 A、2、3、…、 
10、J、Q、K 这 样 的 顺序 排列 。 例 如 ， 梅 花 A 的 位 置 就 是 9， 梅花 K 的 位 置 是 12, 方块 A 的 位 置 是 
13， 而 黑 桃 ] 的 位 置 是 49。 红 桃 同 花 大 顺 ( 即 红 桃 10、J、Q、K、A ) 是 由 以 下 特征 向 量 表 示 的 
0000000000000000000000000010000000011110000000000000 
第 一 个 1 在 位 置 26 处 ， 表 示 红 桃 A， 而 其 他 4 个 1 则 是 在 35 到 38 这 4 个 位 置 ， 它 们 分 别 表示 红 桃 10、 
J]、Q 和 K。 
所 有 梅花 花色 的 牌 组 成 的 集合 是 由 以 下 特征 回 量 表示 的 
1111111111111000000000000000000000000000000000000000 
而 所 有 花 牌 ( 即 各 花色 的 JJ _Q、 玉 ) 组 成 的 集合 则 是 由 以 下 特征 向 量 表示 的 
0000000000111000000000011100000000001110000000000111 


























J 当然 ，U 不 可 能 是 真正 的 全 集 ， 我 们 用 罗素 悖 论 论证 过 这 种 所 有 集合 的 集合 是 不 存在 的 。 
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7.5.1 集合 的 数组 实现 
要 表示 某 n 元 素 全 集 各 子 集 的 特征 向 量 ， 可 以 使 用 具有 如 下 类 型 的 布尔 数组 : 


typedef BOOLEAN USET[n]; 
我 们 在 1.6 节 中 描述 过 BOOLEAN 类 型 。 要 将 对 应 位 置 ;的 元 素 搬 入 到 声明 为 USET 类 型 的 集合 s 中 ， 
只 需要 执行 




















S[i] = TRUE; 
同样 ， 要 从 5 中 删除 对 应 位 置 的 元 素 ， 就 要 
S[i] = FALSE; 








如 果 要 查找 该 元 素 ， 只 需 返 回 值 $[] 即 可 ， 该 值 就 告诉 了 我 们 第 i 个 元 泰 是 否 出 现在 S$ 中 。 

请 注意 ， 当 集合 用 特征 癌 量 表示 时 ,词典 操作 插入 、 删 除 和 查找 各 需 0() 的 时 间 。 这 一 技 
巧 的 唯一 缺点 是 ， 所 有 被 表示 的 集合 都 必须 是 某 个 全 集 U 的 子 集 。 此 外 ， 该 全 集 必 须 很 小 ， 否 
则 ， 数 组 就 会 变 得 很 大 ， 要 存储 数组 就 不 方便 了 。 事 实 上 ， 因 为 我 们 通常 一 定 要 将 表示 集合 的 
数组 中 所 有 元 素 初 始 化 为 TRUE 或 FALSE， 而 初始 化 U0 的 任 一 子 集 ( 即便 是 名 ) 所 花 的 时 间 都 肯 
定 与 0 的 大 小 成 比例 。 如 果 U 中 有 大 量 的 元 素 , 那么 初始 化 集合 所 花 的 时 间 可 能 会 主导 所 有 其 他 
操作 的 开销 。 

如 果 两 个 集合 同 为 某 n 元 素 普通 全 集 的 子 集 , 它们 分 别 由 特征 向 量 S 和 7 表示 , 要 构成 这 两 个 
集合 的 并 集 ， 可 以 定义 男 一 个 特征 癌 量 R 来 表示 特征 癌 量 S 和 7 的 按 位 OR: 

对 0 夺 i 三 n, R[i] = S[i] || TI[i] 
同样 ， 要 让 R 表 示 S 和 7 的 交集 ， 就 只 要 对 S 和 7 的 特征 问 量 按 位 ANI 

对 0 三 i 三 n, R[i] = S[i] && TI[i] 
最 后 ， 可 以 按照 如 下 方式 让 R 表 示 S 和 7 的 差 集 S -7: 

对 0 夺 i 三 n, R[i] = S[i] && !T[i] 
如 果 恰 当地 定义 类 型 BOOLEAN， 表 示 特 征 疝 量 的 数组 及 对 这 些 数组 执行 的 布尔 运算 都 可 以 用 C 
语言 中 的 按 位 运算 符 实现 。 不 过, 这 些 代 码 都 是 与 机 器 相关 的 , 所 以 在 这 里 不 会 展示 任何 细 市 。 
寺 征 问 量 有 一 种 可 移植 但 更 耗费 空间 的 实现 ， 可 以 用 合适 大 小 的 ijnt 类 型 数组 实现 ， 而 这 是 一 
种 我 们 假设 过 的 BOOLEAN 类 型 的 定义 。 


+ 示例 7.14 
考虑 一 下 苹果 品种 的 集合 。 这 里 的 全 集 由 图 7-9 所 示 的 6 个 品种 构成 ， 其 排列 次 序 表示 了 它 
们 在 特征 向 量 中 的 位 置 。 


























U 









































品 种 
美味 ( Delicious ) 
格 兰 尼 ' 史密斯 ( Granny Smith ) 
格拉 文 施 泰 因 〈Gravenstein ) 

















乔纳森 ( Jonathan ) 
但 苹果 ( McIntosh ) 
深 玉 苹 果 (Pippin ) 





图 7-9 ” 茶 些 苹果 品种 的 特征 
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红 苹 果 的 集合 是 由 特征 向 量 
Red =01110 
表示 的 ， 而 早熟 苹果 的 集合 是 由 特征 向 量 
Early = 011100 
表示 的 。 因此, 由 红色 或 早熟 的 苹果 品种 构成 的 集合 , 即 Red U Early , 是 由 特征 向 量 111110 
表示 的 ,请 注意 , 这 一 向 量 为 1 的 位 置 , 是 表示 Red 的 特征 向 量 101110 中 为 1 的 位 置 ,或 是 表示 Early 
的 特征 向 量 011100 中 为 1 的 位 置 ， 或 是 两 者 中 都 为 1 的 位 置 。 
通过 在 101110 和 011100 都 为 1 的 位 置 放置 1, 可 以 得 到 表示 Red Nn Early ( 早熟 红 苹果 的 集合 ) 
的 特征 向 量 。 得 到 的 向 量 是 001100， 表 示 苹 果品 种 的 集合 { 格 拉 文 施 泰 因 乔纳森 }。 而 晚熟 红 
苹果 的 集合 ， 也 就 是 








Red — Early 
可 以 用 向 量 100010 表 示 。 该 集合 为 {美味 ， 旭 苹果 }。 
请 注意 ， 使 用 特征 变量 求 并 集 、 交 集 和 差 集 所 花 的 时 间 与 向 量 的 长 度 是 成 正比 的 。 这 一 长 
度 与 待 运算 集合 的 大 小 没有 直接 关系 ， 而 是 等 于 所 选择 全 集 的 大 小 。 如 果 待 运算 集合 占据 全 集 
中 相当 可 观 的 一 部 分 元 素 ， 那 么 求 并 集 、 交 集 和 差 集 的 时 间 也 和 待 运算 集合 的 大 小 成 比例 。 这 
一 时 间 要 优 于 已 排序 表 的 O(nlogn) 时 间 ， 且 大 大 优 于 未 排序 表 的 O(n”) 时间。 不 过 ,特征 问 量 
也 有 个 缺点 ,假如 所 涉及 集合 的 大 小 远 小 于 全 和 集 的 大 小 ， 这 些 运 算 的 运行 时 间 就 要 远大 于 所 涉 
及 集合 的 大 小 。 


7.5.2 习题 


(1) 给 出 如 下 扑克 牌 集合 的 特征 向 量 。 为 了 方便 起 见 , 大 家 可 以 使 用 0 表示 kf 个 连续 的 0, 用 1 这 示 1 个 连 
续 的 1。 
(a) 皮 诺 奇 勒 牌 堆 (使 用 4 种 花色 的 9 、10、J、Q、K 和 A 各 两 张 ) 中 的 扑克 牌 。 
(b) 红色 扑克 牌 。 
(c) 红 桃 J、 黑 桃 J 和 和 红 桃 K。 

(2) 使 用 按 位 运算 符 ， 编 写 C 语 言 程序 计算 两 个 扑克 有 牌 集合 的 (a) 并 集 ; (b) 差 集 ， 其 中 第 一 个 集合 是 用 
单词 c1 和 ca2 表 示 的 ， 而 第 二 个 集合 则 是 由 51 和 Z2 表 示 的 。 

(3)* 假设 要 表示 元 素 包含 于 某 小 型 全 集 避 的 无 序 单位 组 (多重 集 ) 。 该 如 何 将 特征 向 量 法 推广 到 无 序 
单位 组 的 表示 呢 ? 说 明 要 如 何 对 这 样 表示 的 无 序 单 位 组 执行 (8) 插 入 ，(b) 删 除 ; (c) 查 找 操作 。 请 注 
意 ， 无 序 单 位 组 的 lookup(@) 返 回 的 是 x 在 无 序 单 位 组 中 出 现 的 次 数 。 


























7.6 ”和 散 列 


在 可 以 使 用 词典 的 特征 向 量 表示 时 ， 我 们 可 以 直接 访问 表示 元 素 的 位 置 ， 也 就 是 访问 数组 
中 以 该 元 素 的 值 为 下 标的 位 置 。 不 过 ， 正 如 前 面 提 到 过 的 ， 不 能 让 全 集 的 大 小 太 大 ， 和 否则 数组 
长 度 就 会 超出 计算 机 可 用 内 存 的 容纳 能 力 了 。 就 算计 算 机 内 存 能 容纳 这 个 数组 ， 初 始 化 数组 所 
需 的 时 间 也 太 长 了 。 例 如 ， 假 设 要 存储 真正 的 英文 词典 ， 并 假设 我 们 愿意 忽略 10 个 字母 以 上 的 
单词 。 仍 会 有 26 “+26 + 口 +26 个 可 能 存在 的 单词 ， 这 大 约 是 超过 10 个 单词 ， 每 个 可 能 的 单词 都 
需要 数组 的 一 个 位 置 。 

不 过 , 不 管 什么 时 候 , 英语 语言 中 一 般 只 有 100 万 个 单词 , 所 以 之 前 所 说 的 数组 中 只 有 一 亿 
分 之 一 的 数据 项 为 TRUE。 我 们 也 许可 以 缩减 该 书 组 , 使 得 很 多 可 能 存在 的 单词 共享 一 个 数据 项 。 
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例如 ， 假 设 指定 头 100 万 个 单词 存放 在 数组 的 第 一 个 单元 中 ， 而 接 下 来 的 100 万 个 可 能 存在 的 单 
词 存 放 在 第 二 个 单元 中 ， 以 此 类 推 ， 直 到 第 100 万 个 单元 。 这 种 安排 有 两 个 问题 。 

(1) 在 单元 中 只 放 入 TRUE 已 经 不 够 了 , 因为 我 们 没 法 知道 这 100 万 个 可 能 的 单词 中 到 底 有 哪 
些 实际 出 现在 词典 中 ， 也 不 知道 任意 一 组 中 是 否 有 多 个 单词 出 现 。 

(2) 比方 说 ， 如 果 头 100 万 个 可 能 的 单词 包含 了 所 有 的 短 单词 ， 就 可 以 预期 有 超过 平均 数 的 
词典 内 单词 落 入 这 一 组 可 能 存在 的 单词 中 。 要 注意 到 ， 我 们 的 安排 是 数组 单元 数 要 和 词典 中 的 
单词 数 相 当 ， 这 样 就 可 以 预期 平均 每 个 单元 要 表示 一 个 单词 ， 但 英语 中 肯定 有 好 几 千 个 单词 是 
在 第 一 组 中 的 ， 这 样 就 包含 了 所 有 不 超过 5 个 字母 的 单词 ， 以 及 部 分 6 个 字母 的 单词 。 

要 解决 问题 (0)， 就 需要 在 数组 的 每 个 单元 中 列 出 该 组 中 出 现在 词典 里 的 所 有 单词 。 也 就 是 
说 ,该 数组 单元 成 了 容纳 这 些 单词 的 链表 的 表 头 。 要 解决 问题 (2)， 需 要 注意 如 何 为 潜在 的 单词 
分 组 。 一定 要 合理 分 配 各 组 中 的 元 素 ， 使 得 不 大 可 能 出 现 (虽然 从 不 会 不 出 现 ) 某 一 组 中 有 很 
多 元 素 的 情况 ， 虽 然 这 种 情况 不 太 可 能 不 出 现 。 请 注意 ， 如 果 在 一 组 中 有 大 量 的 元 素 ， 而 且 我 
们 又 用 链表 来 表示 组 ， 那 么 在 成 员 众多 的 组 中 查找 元 素 就 会 非常 缓慢 。 


7.6.1 ” 散 列 表 数 据 结构 

我 们 现在 已 经 从 特征 向 量 这 种 使 用 范围 有 限 但 很 有 价值 的 数据 结构 ， 演 变 到 了 对 任意 词典 
都 很 有 用 而 且 对 很 多 其 他 用 户 来 说 也 很 实用 的 散 列 表 数据 结构 。 散 列表 的 词典 操作 速度 平均 可 
达 OU) 的 水 平 , 而 且 与 构建 词典 所 用 全 集 大 小 没有 关系 。 图 7-10 中 展示 了 散 列 表 的 图 片 , 不 过 ， 
我 们 只 给 出 了 x 所 在 的 那 一 组 对 应 的 链表 。 
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图 7-10” 散 列表 
散 列 函数 接受 元 素 x 作 为 参数 ， 并 生成 0 到 有 -1 之 间 的 某 个 整数 值 ， 其 中 8 是 散 列 表 中 散 列 
表 元 (bucket ) 的 数量 。 值 h(x) 就 是 我 们 放置 元 素 x 的 散 列 表 元 的 位 置 。 因 此 ， 这 些 散 列表 元 
与 我 们 之 前 非 正 式 讨论 中 谈论 过 的 单词 “组 ”是 对 应 的 ， 而 散 列 函数 是 用 来 决定 某 个 给 定 元 








J 虽然 有 的 情况 下 用 特征 向 量 也 是 可 行 的 ， 但 我 们 通常 还 是 会 优先 选择 用 散 列表 来 表示 。 
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素 应 该 属于 哪个 散 列 表 元 的 。 

使 用 何 种 散 列 函数 更 合适 取决 于 元 泰 的 类 型 。 例 如 

(1) 如 果 元 素 是 整数 ， 就 可 以 令 h(x) 为 x%B， 也 就 是 x 除 以 B 的 余数 。 这 一 数字 总 是 在 所 要 求 
的 0 到 B-1 这 一 范围 内 。 

(2) 如 果 元 素 是 字符 串 ， 就 可 以 取 元 素 x=aa,…a, ， 其 中 每 个 a 都 是 一 个 字符 ， 并 计算 
y= a +q,t+"…+a, ， 因 为 在 C 语 言 中 char 类 型 是 个 小 整数 。 这 样 ， 我们 就 得 到 与 字符 串 x 中 所 有 
字符 等 价 的 整数 的 和 y。 如 果 用 y 除 以 B， 并 取 余 数 ， 就 得 到 了 在 0 到 8B-1 这 一 范围 内 的 散 列 表 
元 号 。 
重点 在 于 散 列 函数 会 “混杂 ”该 元 素 。 也 就 是 说 ,，h 会 混杂 元 素 要 落 入 的 散 列 表 元 ， 这样 一 来 这 
些 元 素 大 约 就 是 会 平均 落 和 人 所 有 的 散 列 表 元 中 。 即 便 元 素 本 身 相 当 有 规律 ， 比 如 是 连续 整数 ， 
或 者 只 有 一 个 位 置 不 同 的 连续 字符 串 ， 这 种 公平 分 配 也 一 定 会 发 生 。 

每 个 散 列 表 元 都 是 由 链表 组 成 的 ， 该 链表 存储 着 散 列 函数 发 送 给 该 散 列表 元 的 集合 中 的 所 
有 元 素 。 要 找到 元 素 x， 就 要 计算 h(x)， 得 到 散 列 表 元 号 。 如 果 x 在 ， 它 肯定 就 在 h(x) 对 应 的 散 列 
表 元 中 ,这 样 我 们 可 以 沿 着 该 散 列 表 元 对 应 的 链表 查找 x。 实 际 上 ， 散 列表 让 我 们 使 用 了 较 慢 的 
集合 的 表 实 现 ， 不 过 ， 通 过 将 集合 分 为 B 个 散 列 表 元 ， 让 我 们 在 查找 表 时 平均 只 需要 查找 整个 
集合 的 WB。 如 果 让 B 差 不 多 和 集合 的 大 小 一 样 大 ， 那 么 平均 每 个 散 列 表 元 中 就 只 有 一 个 元 素 ， 
这 样 查找 元 素平 均 只 需要 0() 的 时 间 了 ， 就 像 在 集合 的 特征 向 量 表示 中 那样 。 


























+ 示例 7.15 

假设 我 们 要 存储 某 字符 串 集合 ， 每 个 字符 串 都 以 空 字符 结尾 ， 而 且 最 多 只 含 32 个 字符 。 我 
们 要 使 用 上 述 第 (2) 条 中 提 到 的 散 列 函数 ， 其 中 B-=5， 也 就 是 说 ， 是 有 5 个 散 列表 元 的 散 列表 。 要 
计算 每 个 元 素 的 散 列 值 ， 就 要 求 出 每 个 字符 串 中 直到 空 字 符 为 止 〈 但 不 包括 空 字符 ) 各 字符 的 
整数 值 之 和 。 以 下 定义 给 了 我 们 想 要 的 类 型 。 


(1) #define B 5 

(2) typedef char ETYPE[32]; 

(3) DefCell (ETYPE, CELL, LIST); 
(4) typedef LIST HASHTABLE [B] ; 








第 (1) 行 定义 了 表示 散 列 表 元 数量 5 的 常量 8。 第 (2) 行 定义 的 ETYPE 类 型 是 可 容纳 32 个 字符 的 
数组 。 第 (3) 行 是 常见 的 链表 及 链表 单元 的 定义 ， 只 不 过 这 里 的 元 素 是 ETYPE 类 型 的 ， 也 就 是 32 
字符 的 数组 。 第 (4) 行 将 散 列 表 定 义 为 由 B 个 链表 组 成 的 数组 。 如 有 果 接 着 定义 

HASHTABLE headqers ; 
headers 数 组 有 着 包含 散 列 表 元 头 部 的 合适 类 型 。 














int h(ETYPE x) 


int i, sum; 

sum = 0; 

for (i = 0; x[i] != '\0'; i++) 
sum += x[i]; 

return sum % B; 











图 7-11 假设 ETYPE 是 字符 数组 ， 为 与 字符 等 价 的 整数 求 和 的 散 列 函数 
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现在 必须 定义 散 列 函数 h。 该 函数 的 代码 如 图 7-11 所 示 。 与 字符 串 x 中 各 字符 等 价 的 整数 会 
在 变量 sum 中 求 和 。 最 后 一 步 会 计算 这 个 和 除 以 散 列 表 元 数 B 得 到 的 余数 ,并 将 其 作为 散 列 孔 数 
h 的 值 返回 。 

下 面 拿 一 些 单词 作为 例子 , 并 考虑 散 列 图 数 /安放 这 些 单词 的 散 列 表 元 。 要 在 散 列 表 中 输入 
7 不 单词 ” 

anyone lived in a pretty how town 
要 计算 h(anyone)， 束 需要 搞 清楚 字符 表示 的 整数 值 。 在 常用 于 表示 字符 的 ASCII 码 中 ， 小 写字 
母 对 应 的 整数 值 从 表示 a 的 97( 二 进 制 的 1100001 ) 开始 , 到 表示 pb 的 98, 等 等 , 直到 表示 z 的 122。 
而 大 写字 母 对 应 的 整数 要 比 相应 小 写字 母 对 应 的 整数 小 32， 也 就 是 从 表示 A 的 65 (二进制 的 
1000001 ) 到 表示 Zz 的 90。 

因此 ， 与 anyone 中 的 字符 对 应 的 整数 分 别 是 97、110、121、111、110、101。 它 们 的 和 是 
650。 将 这 个 和 除 以 ， 也 就 是 5， 得 到 余数 为 0。 因 此 ，anyone 属 于 散 列 表 元 0。 通 过 图 7-11 中 
的 散 列 函数 ， 就 可 以 将 本 例 中 的 7 个 单词 分 配 到 如 图 7-12 所 示 的 散 列 表 元 中 。 














单 ” 词 和 散 列 表 元 
anyone 650 0 
lived 532 2 
in 215 0 
a 97 2 
pretty 680 0 
how 334 4 
town 456 1 








图 7-12 ”各 个 单词 、 它 们 的 值 和 它们 所 在 的 散 列 表 元 


我 们 看 到 7 个 单词 中 有 3 个 被 分 配 到 编号 为 0 的 散 列 表 元 中 ,有 两 个 被 分 配 到 2 号 散 列 表 元 中 ， 
而 1 号 和 4 号 中 各 有 一 个 单词 。 这 与 一 般 情 况 相 比 不 那么 平均 ， 不 过 对 少量 的 单词 和 散 列 表 元 来 
说 , 我们 应 该 能 预见 这 种 不 规则 的 情况 。 随 着 单词 数 变 多 , 这 些 单词 在 5 个 散 列 表 元 中 的 分 布 就 
会 近似 平均 了 。 插 入 了 这 7 个 单词 之 后 的 散 列 表 如 图 7-13 所 示 。 


headers 





图 7-13 ”存放 7 个 元 素 的 散 列 表 





Q 这 些 单词 来 自 E.E.Cummings 的 一 首 同 名 诗 ， 该 诗 的 下 一 句 是 “with up so floating many bells down”。 
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7.6.2 ”词典 操作 的 散 列 表 实 现 


要 在 用 散 列 表 表示 的 词典 中 插入 、 删 除 或 查找 元 素 x， 要 经 历 人 简单 的 3 步 过 程 。 

(1) 计算 合适 的 散 列 表 元 ， 也 就 是 h(x)。 

(2) 利用 由 表 头 指针 组 成 的 数组 ， 找 到 与 标记 为 h(x) 的 散 列 表 元 对 应 的 存储 元 素 的 表 。 

(3) 对 该 表 执 行 操 作 ， 就 像 该 表 表 示 了 整个 集合 一 样 。 
针对 这 里 的 元 素 是 字符 串 而 6.4 中 的 元 素 是 整数 这 一 事实 ， 对 6.4 节 中 的 算法 经 过 恰当 的 修改 之 
后 ， 该 算法 可 以 用 于 这 里 的 表 操 作 。 举 例 来 讲 ， 我 们 在 图 7-14 中 展示 了 癌 散 列表 插入 元 素 的 完 
整 图 数 。 大 家 可 以 自行 开发 elete 和 1ookup 困 数 作为 练习 。 














#include <string.h> 


void bucketInsert (ETYPE x, LIST *pL) 
{ 
(1) if ((*pL) == NULL) { 
(2) (*pL) = (LIST) malloc(sizeof (struct CELL) ) ; 
(3) strcpy((*pL)->element, xX); 
(4) CpL)->next = NULL; 





(5) else if (strcmp((*pL)->element, x)) /* x 和 element 
是 不 同 的 */ 

(6) bucketInsert(x, &((*pL)->next)); 

} 

void insert (ETYPE x, HASHTABLE H) 

{ 
(7) bucketInsert (x, &(H[Ih(x)])); 

} 





图 7-14 ”向 散 列 表 中 插入 元 素 
要 理解 图 7-14， 可 以 注意 到 函数 pucketInsert 与 图 6-5 中 的 函数 insert 是 相似 的 。 在 第 








(1) 行 , 我 们 进行 测试 , 看 看 是 否 已 到 达 表 的 末端 。 如 果 是 , 就 在 第 (2) 行 创建 一 个 新 单元 。 不过， 
在 第 (3) 行 ， 我 们 不 再 是 把 整数 存储 到 新 创建 的 单元 中 ， 而 是 利用 标准 头 文件 string.n 里 的 
strcpy 函 数 将 字符 串 x 复 制 到 该 单元 的 元 素 字 段 。 

还 有 ， 在 第 (3) 行 ， 我 们 会 使 用 string.h 中 的 stzrcmp 图 数 测试 是 否 尚 未 在 该 表 中 找到 x。 
当 且 仅 当 x 和 当前 单元 的 元 素 相等 时 ,该 函数 会 返回 9。 因 此， 只 要 这 一 比较 的 值 非 0， 也 就 是 只 
要 当前 元 素 不 是 zx， 我 们 就 会 沿 着 表 继 续 向 下 。 

这 里 的 ijnsert 函 数 只 有 一 行 代码 ， 在 这 行 代码 中 ， 当 我 们 找到 对 应 适当 散 列 表 元 h(x) 头 部 
的 数组 元 素 之 后 ， 就 会 调用 pucketInsert。 我 们 假设 该 散 列 函数 是 在 其 他 位 置 定义 的 。 还 
要 记得 ， 类 型 HASHTABLE 意 味 着 H 是 指 癌 各 单元 指针 组 成 的 数组 ( 即 链表 数组 )。 


+ 示例 7.16 

假设 我 们 要 从 图 7-13 所 示 的 散 列 表 中 删除 元 素 in， 而 使 用 的 散 列 孔 数 是 示例 7.15 描 述 的 。 
删除 操作 的 执行 方式 从 根本 上 讲 与 图 7-14 中 的 insert 函 数 是 类 似 的 。 我 们 会 计算 h(in)， 其 值 
为 0。 因 此 我 们 前 往 0 号 散 列 表 元 对 应 的 表 头 。 该 散 列 表 元 对 应 的 表 中 第 二 个 单元 存放 着 in， 要 
删除 该 单元 。 具 体 的 C 语 言 程 序 留 作 本 节 习 题 。 
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7.6.3” 散 列表 操作 的 运行 时 间 


正如 我 们 通过 检视 图 7-14 可 以 了 解 的 ,假设 计算 h(x) 所 花 的 时 间 是 个 与 存储 在 散 列 表 中 的 元 
素数 量 无 关 的 常量 ，" 函数 insert 找 到 适当 散 列 表 元 头 部 所 需 的 时 间 是 0() 。 在 这 个 常数 的 基 
础 之 上 ， 还 必须 加 上 平均 为 O(n/B) 的 附加 时 间 ， 甚 中 zx 是 散 列 表 中 的 元 素数 量 ， 而 了 3 则 是 散 列 
表 元 的 数量 。 原 因 在 于 ，bucketInsert 要 花费 与 链表 长 度 成 比例 的 时 间 ， 而 这 一 长 度 平 均 而 言 
肯定 是 元 素 总 数 除 以 散 列表 元 数 ， 也 就 是 z/B。 

一 个 有 趣 的 结果 就 是 ， 如 果 让 B 约 等 于 集合 中 元 素 的 数量 ， 也 就 是 说 ， 令 za 和 8 非常 接近 ， 
则 nn/B 大 约 为 1， 对 散 列 表 执 行 各 种 词典 操作 平均 花费 O00) 的 时 间 ， 就 和 我 们 使 用 特征 向 量 表 
示 时 一 样 了 。 如 果 尝 试 通过 让 Bt 比 n 大 得 多 来 改善 时 间 ， 会 使 多 数 散 列表 元 为 空 ， 而 这 样 做 之 后 
找到 散 列 表 元 头 部 仍然 要 花 O0) 的 时 间 ， 因 此 让 B 比 n 大 很 多 并 不 会 显著 改善 运行 时 间 。 

还 必须 考虑 到 ， 在 某 些 情况 下 ， 可 能 没 法 让 8 一 直 与 z 很 接近 。 如 果 该 集合 增长 迅速 ， 那 么 
n 增 加 了 而 8 仍然 不 变 ， 最 终 n/B 会 变 得 很 大 。 重 组 散 列 表 是 有 可 能 的 ， 只 要 通过 为 B 选 择 一 个 
更 大 的 值 ， 然 后 将 每 个 元 素 都 插入 新 的 散 列 表 中 。 完 成 这 一 工作 需要 O(n) 的 时 间 ， 不 过 这 一 时 
间 不 会 大 于 辐 先 前 的 散 列 表 中 搬入 m 个 元 素 所 需 的 OU 时 间 。 请 注意 ， 这 里 的 总 时 间 O(n) 是 执 
行 n 次 插入 所 花 的 时 间 ， 每 次 插入 平均 花费 时 间 为 0() 。 





























7.6.4 习题 


(1) 继续 向 图 7-13 中 的 散 列 表 填 充 单 词 with up so floating many bells down。 
(2)* 评价 一 下 ,下列 散 列 函数 在 将 常用 英语 单词 集合 分 成 大 小 基本 相同 的 散 列 表 元 时 ,效率 有 多 高 。 
(a) 使 用 B=10 ， 并 设 h(x) 是 单词 长 度 x 除 以 10 得 到 的 余数 。 
(b) 使 用 B=128 ， 并 设 h(x) 是 单词 x 最 后 一 个 字符 的 整数 值 。 
(c) 使 用 B =10 。 求 单词 zx 中 各 字符 对 应 整数 值 的 和 。 取 求 和 结果 的 平方 ， 然 后 取 该 结果 除 以 10 的 
(3) 使 用 与 图 7-14 所 示 代 码 相同 的 假设 ,编写 C 语 言 程序 ， 用 于 对 散 列 表 执 行 (a) 删 除 ; (b) 查 找 操作 。 


7.7 ”关系 和 函数 


尽管 一 般 会 假设 集合 中 的 元 素 都 是 原子 的 ， 不 过 在 实践 中 让 元 素 具 有 某 种 结构 往往 是 很 实 
用 的 。 例 如 ， 在 7.6 节 中 我 们 谈论 了 长 32 个 字符 的 字符 串 元 素 。 另 一 种 可 作为 元 素 的 重要 结构 是 
定 长 表 ， 它 们 和 C 语 言 的 结构 体 类 似 。 用 作 集 合 元 素 的 表 称 为 元 组 〈tuple )， 表 中 每 个 元 素 称 为 
元 组 的 组 分 ( component )。 

元 组 中 组 分 的 数量 称 为 元 组 的 元 数 ( arity )。 例 如 ，(a,b) 是 元 数 为 2 的 元 组 ， 其 第 一 个 组 分 
为 4， 第 二 个 组 分 为 5。 元 数 为 的 元 组 也 称 为 jE 组。 

以 具有 相同 元 数 ( 比方 说 是 ) 的 元 组 为 元 素 形 成 的 集合 称 为 关系 。 这 一 关系 的 元 数 就 是 
元 数 为 1 的 元 组 或 关系 是 一 元 的 。 如 果 元 数 为 2， 就 是 二 元 的 。 一 般 来 说 ， 如 果 元 数 为 K， 那 么 元 
组 或 关系 就 是 k 元 的 。 























J 这 可 能 是 图 7-11 所 示 散 列 函 数 的 情况 ， 也 可 能 是 实践 中 直到 的 大 多 数 散 列 函数 的 情况 。 计 算 散 列表 元 编号 的 时 
间 可 能 取决 于 元 素 的 类 型 。 例 如 ， 更 长 的 字符 串 可 能 需要 为 更 多 的 整数 求 和 ， 但 这 一 时 间 与 存储 的 元 素数 量 没 
关系 。 
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+ 示例 7.17 

关系 尺 ={(1,2),(1,3),(2,2)} 就 是 元 数 为 2 的 关系 , 也 就 是 二 元 关系 。 它 的 成 员 分 别 为 (1.2), (1,3) 
和 (2.2)， 都 是 元 数 为 2 的 元 组 。 

在 本 节 中 ， 我 们 主要 考虑 二 元 关系 。 还 有 很 多 非 二 元 关系 的 重要 应 用 ， 特 别 是 在 表 列 数据 
( 就 像 在 关系 数据 库 中 那样 ) 的 表示 和 操作 中 。 我 们 将 在 第 8 章 中 进一步 讨论 该 主题 。 


7.7.1 笛 卡 儿 积 


在 正式 研究 二 元 关系 之 前 ， 和 需要 定义 男 一 种 集合 运算 。 设 4 和 8B 是 两 个 集合 ， 表 示 为 4xB 
的 4 和 B 的 积 ， 是 指 从 A 中 选 出 第 一 个 组 分 并 从 B 中 选 出 第 二 个 组 分 所 组 成 的 有 序 对 的 集合 ， 也 


就 是 





AxB={(a,b)lae AHbeB} 
该 乘积 有 时 也 叫 作 备 卡 儿 积 ， 是 以 法 国 数学 家 勒 内 : 笛 卡 儿 的 名 字 命 名 的 。 


+ 示例 7.18 

回想 一 下 ， 符 号 Z 约 定 俗 成 是 表示 所 有 整数 的 集合 的 。 因 此 ，Z x Z 就 表示 整数 有 序 对 的 
集合 。 

再 举 个 例子 , 如 果 4 是 双 元 素 集 {1,2}, 而 83 是 三 元 素 集 {a,b,c}, 那么 4 x B 就 是 6 元 素 集 {(1,q)， 
(1,b), (1,c), (2,a), (2,b), (2,0)}。 

请 注意 ,集合 的 积 这 一 名 称 是 名 副 其 实 的 , 因为 如 果 4 和 B 都 是 有 限 集 , 那么 4 x 8B 中 元 素 的 
数量 ， 正 好 是 4 中 元 素数 量 乘 以 了 中 元 素数 量 的 积 。 


7.7.2 两 个 以 上 集合 的 笛 卡 儿 积 


与 算术 积 不 同 ， 第 卡 儿 积 不 具备 交换 律 和 结合 律 这 些 常 规 属性 。 很 容易 找 出 4 x BzBx4 
的 例子 来 推翻 交换 律 。 而 结合 律 更 是 无 从 说 起 ，(4 x B) x C 的 成 员 有 序 对 具有 ((a,5),c) 的 形式 ， 
而 4 x (Bx CO) 的 成 员 有 序 对 则 形 如 (a,(b,c)) 。 

因为 在 很 多 时 候 需 要 谈论 多 元 组 的 集合 ， 所 以 需要 将 集合 的 积 的 表示 法 扩展 到 k 元 笛 卡 儿 
积 。 设 44x44x…x 妇 表示 集合 4、44、…、44 的 积 ， 也 就 是 说 ,满足 a eA1 目 a e 44 目 … 上 且 
a, eA 的 kt 组 (a, a,,…, a ) 的 集合 。 


+ 示例 7.19 

Z xZxZ 表 示 的 是 整数 三 元 组 (iy, 及 的 集合 ， 例 如 它 包 含 了 三 元 组 (1,2,3)。 不 要 把 该 三 元 笛 
乓 儿 积 与 表示 有 序 对 ((1,2),3) 的 (Z x Z) x Z， 或 是 表示 有 序 对 (1,(2,3)) 的 Z x (Zx 刀 弄 混 了 。 

男 一 方面 ， 要 注意 到 这 3 种 乘积 表达 式 都 可 以 用 由 3 个 整数 字段 组 成 的 结构 体 表示 。 不 同 之 
处 在 于 解释 结构 体 类 型 的 方式 。 因 此 我 们 很 容易 混 消 加 括号 和 不 加 括号 的 乘积 表达 式 。 同 样 ， 
以 下 三 个 C 语 言 类 型 声明 

struct {int fl1; int f2; int f3;}; 


struct {struct {int fi; int f2;}; int f3;}; 
struct {int fi1i; struct {int f2; int f3;};}; 


都 是 以 相似 的 方式 存储 的 ， 只 是 存 取 字段 的 表示 方式 有 所 区 别 。 
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7.7.3 三 元 关 订 


二 元 关系 R 是 作为 集合 4 和 集合 B8 笛 卡 儿 积 子 集 的 有 序 对 集合 。 如 果 关 系 R 是 4 x B 的 子 集 ， 
就 说 R 是 4 到 B 的 关系 。 而 4 就 是 该 关系 的 定义 域 ( domain )，B 就 是 该 关系 的 值 域 (range )。 如 果 
B 和 4 是 相同 集合 ， 就 说 R 是 4 上 的 关系 ,或 者 说 是 “定义 域 ”4“ 上 ”的 关系 。 


+ 示例 7.20 

整数 上 的 算术 关系 < 是 ZxZ 的 子 集 ， 由 那些 满足 a 小 于 bp 的 有 序 对 (a,b) 组 成 。 因 此 ， 符 号 
< 可 被 视 作 集合 {(a,b)|(a,p)eZxZ， 且 a 小 于 b} 的 名 称 。 然 后 我 们 用 a<b 作 为 “(a,p)e <” 或 
“(a,b) 是 关系 < 的 成 员 ” 的 简略 形式 。 而 整数 上 的 其 他 算术 关系 ， 比 如 > 或 二， 也 可 以 按照 相似 
的 方式 定义 ， 而 且 实 数 上 的 算术 比较 都 可 以 按照 相似 的 方式 定义 。 

再 举 个 例子 ,考虑 示例 7.17 中 的 关系 R。 它 的 定义 域 和 值 域 是 不 确定 的 。 我 们 知道 1 和 2 肯定 
在 其 定义 域 中 ， 因 为 这 两 个 整数 是 R 中 元 组 的 第 一 个 组 分 。 同 样 ， 我 们 知道 R 的 值 域 肯 定 包含 2 
和 3。 不 过 ， 可 将 R 看 作 是 {1,2} 到 {2,3} 的 关系 ， 或 是 将 其 视 作 Z 到 Z 的 关系 ， 这 只 是 无 数 选择 中 
的 两 个 例子 而 已 。 


7.7.4 ”关系 的 中 组 表示 

正如 我 们 在 示例 7.20 中 所 表示 的 ， 二 元 关系 的 中 缀 表示 法 是 很 常用 的 ， 所 以 , 像 < 关系 这 
样本 来 是 有 序 对 的 集合 ， 却 可 以 写 在 关系 中 各 有 序 对 的 两 个 组 分 之 间 。 这 也 就 是 为 什么 我 们 通 
常会 看 到 诸如 1<2 和 4 宇 4 这样 的 表达 式 ， 而 不 是 看 到 更 为 学 究 式 的 (1,2)e < 或 (4,4)e 宇 。 
+ 示例 7.21 


关系 的 中 级 表示 法 可 以 用 于 任意 类 型 的 二 元 关系 。 例 如 ， 示 例 7.17 中 的 关系 R 就 可 以 写 为 3 
个 “事实 ”1R2、1R3 和 2R2。 


























声明 的 及 当前 的 定义 域 和 值 域 


示例 7.20 的 第 二 部 分 强调 了 一 点 ， 就 是 不 能 只 从 看 到 的 表象 来 断定 关系 的 定义 域 和 值 域 。 
作为 第 一 个 组 分 出 现 的 元 素 组 成 的 集合 肯定 是 定义 域 的 子 集 , 而 作为 第 二 个 组 分 的 元 素 组 成 的 
集合 一 定 是 值 域 的 子 集 。 不 过 ， 在 定义 域 或 值 域 中 还 可 能 有 其 他 的 元 素 。 

当 关系 不 发 生 改 变 时 ， 这 种 差异 是 不 重要 的 。 不 过 ， 我 们 在 7.8 节 和 7.9 节 ， 以 及 在 第 8 章 的 
内 容 中 会 看 到 ， 值 会 发 生 改 变 的 关系 是 非常 重要 的 。 例 如 ， 我 们 可 能 谈论 某 一 关系 ， 其 定义 域 
是 某 门 课程 中 的 学 生 ， 而 值 域 则 是 一 些 整数 ， 表 示 作 业 的 总 分 。 在 开课 之 前 ， 该 关系 中 是 没有 
有 序 对 的 。 在 第 一 次 作业 被 评分 后 ,每 个 学 生 就 各 有 了 一 个 有 序 对 。 随 着 时 间 的 推移 ,会 有 学 
生 弃 选 这 门 课程 ， 或 是 有 学 生 加 入 该 课程 ， 而 总 分 在 不 断 增加 。 

我 们 可 以 将 该 关系 的 定义 域 定义 为 所 有 在 该 大 学 注册 的 学 生 ， 而 将 值 域 定 义 为 整数 的 集 
合 。 当 然 , 不论 何 时 ， 该 关系 的 值 都 是 这 两 个 集合 笛 卡 儿 积 的 子 集 。 另 一 方面 , 不 管 什么 时 候 ， 
关系 都 具有 当前 定义 域 和 当前 值 域 , 就 是 由 出 现在 关系 中 有 序 对 第 一 个 组 分 和 第 二 个 组 分 位 置 
的 元 素 分 别 构成 的 集合 。 当 我 们 需要 加 以 区 分 时 ， 就 会 将 关系 本 来 的 定义 域 和 值 域 称 作 声 明 的 
定义 域 和 值 域 。 当 前 的 定义 域 和 值 域 分 别 是 声明 的 定义 域 和 值 域 的 子 集 。 
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7.7.5 ”表示 二 元 关系 的 图 


可 以 用 图 来 表示 定义 域 为 4 且 值 域 为 B 的 关系 R。 先 为 在 4 和 (或 ) 3 中 的 每 个 元 素 画 一 个 节 
点 。 如 果 aRb5， 就 夯 一 条 从 a 到 5b 的 第 头 (“ 弧 ”)， 我们 将 在 第 9 革 中 更 详尽 地 讨论 一 般 图 。 








+ 示例 7.22 

表示 示例 7.17 中 关系 R 的 图 如 图 7-15 所 示 。 它 有 表示 1、2、33 个 元 素 的 3 个 节点 。 因 为 1R2， 
所 以 从 节点 1 到 节点 2 有 一 条 弧 。 因 为 1R3， 所 以 有 一 条 从 1 到 3 的 弧 。 而 且 有 2R2， 所 以 有 一 条 从 
节点 2 到 它 本 身 的 弧 。 除 此 之 外 没有 其 他 的 弧 ， 因 为 R 中 不 再 包含 其 他 有 序 对 了 。 


图 7-15 ”表示 关系 {4,2),(1,3),(2,2)} 的 图 


7.7.6 ”函数 


假设 有 从 定义 域 4 到 值 域 3 的 关系 R 具 有 如 此 属性 : 对 其 定义 域 4 中 个 每 个 成 员 a 而 言 ， 在 其 
值 域 8 中 最 多 有 一 个 2 满足 acRD。 这 样 的 R 就 被 称 作 从 定义 域 4 到 值 域 B 的 偏 函 数 。 

如 果 对 4 中 每 个 成 员 a 来 说 ， 都 刚好 在 3 中 有 一 个 元 素 ! 满 足 &RD， 就 说 R 是 从 4 到 B 的 全 函数 。 
偏 函 数 和 全 隐 数 之 间 的 区 别 在 于 ， 偏 函数 可 能 对 其 定义 域 中 的 某 些 元 素 而 言 无 定义 ， 例 如， 对 
4 中 的 某 个 a， 可 能 在 8 中 不 存在 满足 aRb 的 5。 我 们 会 使 用 术语 “函数 ”来 指 代 偏 函 数 更 为 一 般 
化 的 概念 ， 不 过 ， 只 要 偏 函 数 与 全 函数 之 间 的 区 别 关 系 重大 ， 我 们 就 会 用 上 “ 偏 ” 字 。 

有 一 种 常用 的 函数 表示 法 ， 如 果 b 是 满足 aRb 的 唯一 元 素 ， 通 常 就 写成 R(a) = 。 























+ 示例 7.23 

设 S 是 由 {(a,5)|b5=a”} (也 就 是 第 二 个 组 分 为 第 一 个 组 分 平方 的 有 序 对 的 集合 ) 给 出 的 从 Z 
到 Z 的 全 函数 。 那 么 8 具有 诸如 (3,9) 、(-4,16) 和 (0,0) 这 样 的 成 员 。 我 们 可 以 通过 写 出 $(3) = 9 、 
S(-4)=16 和 S(0)=0 来 表示 5S 为 平方 函数 这 一 事实 。 

请 注意 ， 函 数 在 集合 论 中 的 概念 与 C 语 言 中 也 数 的 概念 没有 太 大 区 别 。 也 就 是 说 ,假设 s 是 
具有 如 下 声明 


int s(int a) 
{ 
return a*a; 


} 
的 C 语 言 函数 ， 它 接受 一 个 整数 作为 参数 并 返回 该 整数 的 平方 。 我 们 通常 会 将 s (a) 视 为 与 S(a) 
相同 的 函数 ,尽管 前 者 是 计算 平方 的 一 种 方式 ， 而 后 者 只 是 抽象 地 定义 了 求 平方 的 运算 。 还 要 
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注意 到 ， 在 实际 应 用 中 ，s (a) 总 是 偏 函 数 ， 因 为 出 于 计算 机 算术 能 力 的 限制 ， 有 很 多 a 的 值 让 
s (a) 不 会 返回 整数 。 

C 语 言 中 也 有 接受 多 个 参数 的 函数 。 接受 两 个 整数 参数 a 和 pb, 并 返回 一 个 整数 的 C 语 言 函 数 
f， 就 是 从 Z x Z 到 Z 的 函数 。 同 样 ， 如 果 两 个 参数 分 别 有 着 让 它们 分 属 集合 4 和 集合 8 的 类 型 ， 
而 f 返 回 的 是 类 型 C 的 某 个 成 员 ， 那么 f 就 是 从 4 x B 到 C 的 函数 。 更 一 般 地 讲 ， 如 果 函 数 f 接 受 分 
别 来 自 集合 4、44、…、4 的 k 个 参数 ,并 返回 集合 B 的 某 个 成 员 , 我 们 就 说 f 是 从 4 x4x…x 有 4 
到 B 的 隐 数 。 

例如 ， 可 以 将 6.4 节 中 的 1ookup (x, 工 ) 孔 数 视 作 从 Z xL 到 {TRIE，FALSE} 的 函数 。 这 里 的 L 
是 整数 链表 的 集合 。 
































函数 的 多 种 表示 法 

从 4XB 到 C 的 函数 从 理论 上 讲 是 (4 XB) x C 的 子 集 。 因 此 函数 中 的 有 序 对 都 应 该 具有 
((a,Bb),c) 这 样 的 形式 ， 其 中 a、b、c 分 别 是 集合 4、B、C 的 成 员 。 使 用 涵 数 的 特别 表示 法 ， 可 
以 写成 F(a,b)=c。 

还 可 将 F 视 作 从 4 XB 到 C 的 关系 ， 因 为 每 个 函数 都 是 一 个 关系 。 使 用 关系 的 中 级 表示 法 ， 
((a,5),c) 在 F 中 这 一 事实 也 可 以 写 为 (a,b)Fe 。 

在 将 备 卡 儿 积 扩展 到 多 个 集合 时 ,我 们 可 能 希望 从 乘积 表达 式 中 删除 括号 。 因 此 ,我们 可 
能 将 (4 x B) x C 视 为 技术 上 讲 与 其 不 相等 的 表达 式 4 XBxC。 在 这 种 情况 下 , F 的 成 员 就 可 以 写 
为 (a,b,c) 。 如果 将 所 存储 为 这 种 三 元 组 的 集合 ,就 一 定 要 记 住 前 两 个 组 分 一 起 组 成 定义 域 元 素 ， 
而 第 三 个 组 分 是 值 域 元 素 。 





正式 地 讲 ， 从 定义 域 4 x 4 x…x 4 到 值 域 8 的 函数 ,就 是 形 如 ((a,…, a),b) 的 有 序 对 的 集 
合 ， 其 中 a; 是 集合 4; 的 成 员 ，4b 是 集合 B 的 成 员 。 请 注意 ， 该 有 序 对 的 第 一 个 元 素 本 身 也 是 个 ft 
组 例如， 上 面 提 到 的 ]ookup (x, 工 ) 函数 也 可 以 视 作 有 序 对 ((x, 卫 ,7) 的 集合 ,其 中 x* 是 整数 , 工 
是 整数 链表 ,而 三 么 是 TRUE 要 人 么 是 FALSE， 具体 取决 于 x 是 否 在 链表 LL 中 。 不 管 函数 是 用 Ci 语言 
编写 的 ， 还 是 在 集合 论 中 正式 定义 的 ， 都 可 以 将 其 视 为 一 个 从 定义 域 集合 接受 某 个 值 并 生成 值 
域 中 某 个 值 的 容 句 ， 如 表示 图 数 1ookup 的 图 7-16 所 示 。 


图 7-16 ”机 数 将 定义 域 中 的 元 素 与 值 域 中 唯一 的 元 素 关 联 起 来 














7.7.7 一 一 对 应 


设 从 定义 域 4 到 值 域 3 的 偏 函数 F 具 有 下 列 属性 。 

(1) 对 4 中 的 每 个 元 素 a， 在 8 中 都 有 一 个 元 素 b 满 足 F(a)=b。b。 

(2) 对 8 中 的 每 个 b>， 在 4 中 都 存在 某 个 a 满足 F(a)=。b。 

(3) 在 8 中 没有 这 样 的 »， 使 得 4 中 有 两 个 元 素 a1 和 a 满足 F(a1) 和 F(a,) 都 是 b。 
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这 样 的 F 就 称 为 从 4 到 8B 的 一 一 对 应 。 而 这 种 一 一 对 应 也 可 以 用 术语 双 射 (bijection ) 来 表示 。 

属性 (1) 表 示 Ff 是 从 4 到 8B 的 全 函数 。 属 性 (2) 是 表示 Ff 是 从 4 到 8B 之 上 的 全 函数 的 条 件 。 一 些 数 
学 家 会 使 用 术语 满 射 ( surjection ) 来 表示 这 种 从 4 到 8B 之 上 的 全 函数 。 

属性 (2) 和 属性 (3) 一 起 表示 FF 就 像 从 B 到 4 的 全 也 数 那 样 。 而 具有 属性 (3) 的 全 函数 有 时 也 被 称 
为 单 射 (injection )。 

一 一 对 应 基本 上 就 是 两 个 方向 上 的 全 捕 数 ,不 过 要 注意 到 ,F 厂 是 否 为 一 一 对 应 不 止 取决 于 F 
中 的 有 序 对 ， 还 取决 于 声明 的 定义 域 和 值 域 。 例 如 ， 可 以 取 任 意 从 4 到 8B 的 一 一 对 应 ， 并 通过 向 
4 中 增加 某 个 在 F 中 未 提 及 的 新 元 素 e 而 改变 定义 域 。 这 样 F 就 不 会 是 从 4U fe} 到 B 的 一 一 对 应 。 


+ 示例 7.24 

示例 7.23 中 从 Z 到 Z 的 求 平方 函数 $ 就 不 是 一 一 对 应 。 它 确实 满足 属性 (D), 因为 对 每 个 整数 i， 
都 存在 某 个 整数 ， 也 就 是 六 , 满足 SQ)= 产 。 不过, 它 不 满足 属性 (2)， 因 为 对 某 些 在 Z 中 的 5», 具 
体 来 说 就 是 所 有 的 负 整 数 , 在 Z 中 不 存在 a 使 得 S(a) =b 。S 也 不 满足 属性 (3), 因为 存在 很 多 两 个 
不 同 的 a 使 S(a) 等 于 同一 个 5b 的 例子 。 例 如 ，5S(3)=9， 而 且 S(-3)=9。 

要 举 一 一 对 应 的 例子 ， 可 以 考虑 定义 为 P(a)=a+1 的 从 Z 到 Z 的 全 防 数 P。 也 就 是 说 ，P 会 
为 任 一 整数 加 1。 例 如 ，P(5)=6 ， 而 且 P(-5)=-4。 还 可 以 将 P 视 作 由 二 元 组 形成 的 集合 
{一 2, 一 1),( 一 1,0),(0,1),(1,2),…} ， 或 者 是 图 7-17 所 示 的 图 。 


图 7-17 表示 函数 P(a)=a+1 这 一 关系 的 图 


我 们 声明 P 是 从 整数 到 整数 的 一 一 对 应 。 首 先 ， 这 是 个 偏 函 数 ， 因 为 当 为 整数 a 加 上 1 时 ， 
可 得 到 唯一 的 整数 a+1。 它 是 满足 属性 (1) 的 ， 因 为 对 每 个 整数 a， 存 在 某 个 作为 P(a) 的 整数 
a+1。 属 性 (2) 也 得 到 满足 ， 因 为 对 每 个 整数 pb»， 都 存在 某 个 整数 ， 即 b-1 ,满足 P(b-1)=。b。 
最 后 ， 属 性 (3) 也 是 满足 的 ， 因 为 对 某 个 整数 bp 而 言 ， 不 存在 这 样 两 个 不 同 的 整数 ， 使 得 给 这 两 
个 整数 各 自 加 上 1 后 都 得 到 b。 

从 4 到 8B 的 一 一 对 应 是 在 4 和 B 的 元 素 之 间 构 建 唯一 关联 的 一 种 方式 ,例如 , 如 果 双 手 合十 ， 
左手 和 右手 的 大 拇指 触 在 一 起 ， 左 手 和 右手 的 食指 触 在 一 起 ， 等 等 。 我 们 可 以 把 左手 手指 集 
合 与 右手 手指 集合 之 间 的 这 种 关联 看 作 一 一 对 应 F, 定义 为 F(“ 左 拇指 ”) =D 右 拇指 口 , F(“ 左 
食指 ”) = 口 右 食 指 口 , 等 等 。 也 可 以 将 这 种 关联 看 作 F 的 道光 数 ,也 就 是 从 右手 到 左手 的 函数 。 
总 的 说 来 ， 可 以 通过 调换 有 序 对 中 组 分 的 次 序 ， 反 转 从 4 到 8B 的 一 一 对 应 ， 从 而 成 为 从 B 到 4 的 
一 一 对 应 。 

左右 手 之 间 存 在 这 种 一 一 对 应 的 结果 就 是 每 只 手 手指 的 数量 是 相同 的 。 这 似乎 是 种 自然 而 
且 直 觉 上 的 概念 ， 当 一 个 集合 到 男 一 个 集合 正好 存在 一 一 对 应 时 ， 这 两 个 集合 有 着 相同 数量 的 
元 素 。 不 过 ， 我 们 在 7.11 节 中 会 看 到 ， 当 集合 为 无 限 集 时 ， 从 这 一 “元 素数 量 相 同 ”的 定义 会 
得 出 一 些 惊人 的 结论 。 








































































































7.7.8 习题 
(1) 给 出 使 4 x 83 不同 于 B x 4 的 集合 4 和 B 的 例子 。 
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(2) 设 R 是 由 aRb、bRc、cRd、aRc 和 bRd 定 义 的 关系 。 
(a) 画 出 表示 R 的 图 。 
(b) R 是 否 为 函数 ? 
(c) 为 R 指 出 两 个 可 能 的 定义 域 ， 并 指出 两 个 可 能 的 值 域 。 
(d) 满足 R 是 S 上 关系 ( 即 定 义 域 和 值 域 都 可 以 是 S ) 的 最 小 集合 S 是 什么 ? 

(3) 设 7 是 树 ， 并 设 S 是 树 7 的 节点 的 集合 。 设 R 是 节点 间 的 “父子 ”关系 ， 也 就 是 说 ， 当 卓 仅 当 c 是 p 的 
子 节点 时 有 cRp。 回 答 以 下 问题 ， 并 验证 子 集 的 答案 。 

(a) 不 管 树 7 是 什么 ，R 是 否 为 偏 函 数 ? 
(b) 不 管 树 7 是 什么 ，R 是 否 为 从 S 到 S 的 全 函数 ? 
(c) R 有 没有 可 能 是 一 一 对 应 ( 即 对 某 树 7 而 言 ) ? 
(d) 表示 R 的 图 是 什么 样 的 ? 

(4) 设 R 是 整数 集合 {1,2…,10} 上 的 关系 ,其 中 如 果 a 和 b 是 不 同 整数 而 且 有 除 1 之 外 的 公约 数 ,就 说 aRb。 
例如 ，2R4，6R9， 但 是 没有 2R3。 
(a) 画 出 表示 R 的 图 。 

(b) R 是 否 为 函数 ?为 什么 ? 

(5)* 虽然 我 们 看 到 8S= (4 x B) x C 和 T=Ax (Bx CO) 是 不 同 的 集合 ,但 是 通过 展示 出 它们 之 间 存 在 的 自 
然 的 一 一 对 应 ， 可 以 证 明 它 们 “从 根本 上 讲 是 相同 的 ”。 对 5S 中 的 每 个 ((a,b),c) 而 言 ， 设 
F(((a,5),c))=(a,(b,c)) 。 证 明 F 是 从 5 到 7 的 一 一 对 应 。 

(6) FQ0)=20 、10F20 和 (10,20)e 这 3 项 陈述 有 何 共 同 之 处 。 

(7) * 关 系 R 的 逆 关 系 ( 简称 R 的 道 ) 是 指 满足 (a,b) 在 R 中 的 有 序 对 (5,a) 的 集合 。 

(a) 说 明 如 何 从 表示 R 的 图 得 出 表示 R 的 首 的 图 。 
(b) 如 果 R 是 全 油 数 ， 那 么 R 的 道 是 否 一 定 为 函数 ?如果 R 是 一 一 对 应 呢 ? 

(8) 证 明 : 当 且 仅 当 某 关 系 及 其 逆 关 系 都 是 全 函数 时 ， 该 关系 是 一 一 对 应 。 


7.8 将 函数 作为 数据 来 实现 
在 程序 设计 语言 中 ， 函 数 通 常 是 由 代码 实现 的 ， 不 过 当 它 们 的 定义 域 很 小 时 ， 可 以 使 用 相 


当 类 似 于 实现 集合 的 技巧 来 实现 它们 。 我 们 在 本 节 中 要 讨论 如 何 使 用 链表 、 特 征 向 量 和 散 列 表 
来 实现 有 限 函 数 。 























作为 程序 的 函数 与 作为 数据 的 函数 


尽管 7.7 节 中 我 们 在 函数 的 抽象 概念 与 C 语 言 中 实现 的 函数 间作 了 很 强 的 类 比 , 不 过 还 是 应 
该 注意 到 它们 间 的 重大 差别 。 如 果 厂 是 C 语 言 隐 数 ， 而 Xx 是 其 定义 域 集合 中 的 成 员 ， 那 么 就 告 
诉 了 我 们 如 何 计算 下 (x) 的 值 。 而 同样 的 程序 对 任意 的 值 x 都 是 起 作用 的 。 

然而 ， 当 我 们 将 函数 表示 为 数据 时 ， 首 先 就 需要 函数 是 由 有 序 对 的 有 限 集 构成 。 其 次 ， 通 
常 这 些 有 序 对 基本 是 不 可 预测 的 。 也 就 是 说 , 在 给 定 x 的 情况 下 , 没什么 方便 的 办 法 来 计算 F(x) 
的 值 。 我 们 能 做 的 最 佳 做 法 就 是 创建 表 给 出 每 个 满足 F(a,)=b, 的 有 序 对 

(au b1), (a2, b2), ***, (lan, bn) 

这 样 的 函数 事实 上 是 数据 ,而 不 是 程序 , 尽管 原则 上 讲 可 以 创建 程序 ,将 这 样 的 表 存 储 为 该 程 
序 的 一 部 分 ， 并 在 给 定 x 的 情况 下 从 内 部 表 中 查找 (x) 。 不 过 ， 更 加 高 效 的 做 法 是 将 该 表单 独 
储存 为 数据 ， 并 利用 可 以 处 理 任 一 这 种 函数 的 通用 算法 来 进行 值 的 查找 。 
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7.8.1 对 函数 的 操作 


最 常 对 函数 执行 的 操作 与 对 词典 的 操作 类 似 。 假设 PF 是 从 定义 域 集合 4 到 值 域 集合 B 的 函数 。 
那么 我 们 可 以 进行 下 述 操作 

(1) 插入 满足 F(a) =。 的 新 有 序 对 (a,5b) 。 唯 一 的 微小 区 别 在 于 ， 因 为 F 一 定 是 函数 ， 所 以 假 
如 其 中 已 经 存在 有 序 对 (a,c) ， 那 么 该 有 序 对 肯定 会 被 (a,5) 替代 。 

(2) 删除 与 (aq) 关联 的 值 。 在 这 里 ,我 们 只 需要 给 出 定义 域 中 的 值 a 即 可 。 如 果 存 在 5b 满 
足 F(q)=b ,有 序 对 (a,b) 就 会 从 集合 中 删除 。 如 果 没 有 这 样 的 有 序 对 , 就 不 会 发 生 任何 改变 。 

(3) 查 找 与 (a) 关联 的 值 ， 也 就 是 说 ， 给 定 定义 域 中 的 值 a， 返回 满 足 F(a) =5 的 值 ?。 如 果 
集合 中 没有 这 样 的 有 序 对 (a,5) ， 就 返回 某 个 特殊 的 值 来 警告 F(a) 是 未 定义 的 。 

















+ 示例 7.25 

假设 F 由 有 序 对 {(3,9),(-4,16),(0,0)} 组 成 , 也 就 是 说 ，FG) =9 、F(-4)=16 而 且 FGO)=0。 
那么 lookup(3) 会 返回 9， 而 1ookup(2) 则 返回 一 个 特殊 的 值 ， 指 示 没 有 值 被 定义 为 (2) 。 如 果 下 
是 “ 求 平方 ” 函数， 那么 值 -1 可 以 用 来 指示 不 存在 的 值 ， 因 为 -1 不 可 能 是 任何 整数 真正 的 平 
方 值 。 

操作 delete(3) 会 删除 有 序 对 (3,9)，delete (2) 则 没有 效果 。 如 果 执 行 insert(5,25)， 那 么 会 在 集 
合 F 中 添加 有 序 对 (5,25), 或 者 说 现在 有 了 (5) = 25 。 如 果 执 行 insert(3,10), 就 会 从 F 中 删除 旧 的 
有 序 对 (3,9)， 并 将 新 的 有 序 对 (3,10) 添 加 到 F 中 ， 这 样 一 来 就 有 了 F(3) =10 。 

















7.8.2 ”函数 的 链表 表示 


函数 作为 有 序 对 集合 , 可 以 像 其 他 任何 集合 那样 存储 在 链表 中 。 定义 含有 3 个 字段 的 单元 是 
很 实用 的 , 一 个 表示 定义 域 的 值 , 另 一 个 表示 值 域 的 值 , 最 后 一 个 表示 指向 下 一 个 单元 的 指针 。 
例如 ， 我 们 可 以 按照 如 下 方式 定义 单元 。 
typedef struct CELL *LIST; 
struct CELL { 
DTYPE domain; 


RTYPE range; 
LIST next; 














其 中 DTYPE 是 定义 域 元 素 的 类 型 ， 而 且 RTYPE 表 示 值 域 元 素 的 类 型 。 那 么 郴 数 就 可 以 表示 为 指 
向 链表 ( 第 一 个 单元 ) 的 指针 。 

图 7-18 中 的 函数 执行 操作 insert(a,5,L)， 假 设 DrYPE 和 RTYPE 都 是 32 字 符 的 数组 。 我 们 查找 
在 domain 字 段 中 含有 值 4 的 单元 。 如 果 找 到 ,就 将 其 range 字 段 置 为 5。 如 果 到 达 链 表 末 端 ， 就 
创建 一 个 新 单元 ， 并 将 (a,5) 存储 进去 。 否 则 ， 测 试 该 单元 中 是 否 含有 定义 域 元 泰 4a。 如 果 有 ， 
那么 就 将 值 域 的 值 改 为 3， 这 样 就 行 了 。 如 果 定 义 域 中 有 a 之 外 的 值 ， 就 递归 地 将 其 插入 链表 
尾部 。 

如 果 函 数 F 中 有 n 个 有 序 对 ,那么 插入 操作 平均 要 花 O(n) 的 时 间 。 同 样 ， 用 于 表示 为 链表 的 
函数 的 aelete 和 1Lookup 国 数 也 平均 需要 O(n) 的 时 间 。 




















sR 
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typedef char DTYPE[32] ，RTYPE[32] ; 


void insert (DTYPE a, RTYPE b, LIST *pL) 
{ 
if ((*pL) == NULL) {/* 在 表 的 末端 */ 
(*pL) = (LIST) malloc(sizeof (struct CELL) ) ; 
strcpy((*pL)->domain, a); 
strcpy((*pL)->range, b); 
(*pL)->next = NULL ; 
} 
else if (!strcmp(a, (*pL)->domain)) /* domain 字段 是 a， 
改变 F(a) */ 
strcpy((*pL)->range, b); 
else /* domain 字段 不 是 a */ 
insert(a, b, &((*pL)->next)); 








图 7-18 ”将 新 事实 插入 表示 为 链表 的 函数 中 


7.8.3 ”函数 的 向 量 表示 

假设 声明 的 定义 域 是 从 0 到 PpNum-1 的 整数 ， 也 可 以 通过 枚 举 类 型 来 定义 。 然 后 我 们 可 以 使 
用 特征 向 量 的 表示 函数 ， 将 表示 特征 向 量 的 类 型 FUNCT 定 义 为 : 

typedef RTYPE FUNCT[DNUM]; 


这 是 判断 该 函数 为 全 函数 或 者 RTYPE 包 含 一 个 可 以 解释 为 “ 值 不 存在 ”的 值 的 关键 所 在 。 











+ 示例 7.26 
假设 我 们 要 存储 与 苹果 有 关 的 信息 ,就 像 图 7-9 中 的 收获 期 信息 , 不 过 现在 希望 给 出 具体 的 
收获 月 份 ， 而 不 是 早熟 /晚熟 这 种 二 元 的 选择 。 通 过 定义 如 下 枚 举 类 型 ,我 们 为 定义 域 和 值 域 中 
的 每 个 元 素 都 关联 了 一 个 整数 常量 : 
enum APPLES {Delicious, GrannySmith, Jonathan, McIntosh, 
Gravenstein, Pippin}; 


enum MONTHS {Unknown, Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, 
Sep, 0ct, Nov, Dec}; 


这 一 声明 将 0 与 标识 符 Delicious 关 联 ， 将 1 与 CrannySmith 关 联 ， 等 等 。 它 还 将 0 与 nknown 关 
联 ， 将 1 与 Jan 关 联 ， 等 等 。 标 识 符 Unknown 表 示 收 获 月 份 是 未 知 的 。 现 在 可 以 声明 数组 

int Harvest [6] ; 
用 该 Harvest 数 组 表示 图 7-19 所 示 的 有 序 对 集合 。 接着 数组 Harvest 就 成 了 图 7-20 那 样 , 其 中 数据 


项 Harvest [Delicious] = oct 意 味 着 Harvest [0] = Qs 


























苹 果 收获 月 份 
美味 ( Delicious ) 十 月 (Oct) 
格 兰 尼 . 史密斯 ( Granny Smith ) 八 月 (Aug ) 
乔纳森 ( Jonathan ) 九 月 (Sep ) 














但 苹果 ( McIntosh ) 十 月 ( Oct ) 
格拉 文 施 泰 因 ( Gravenstein ) 九 月 (Sep) 
涌 玉 弟 果 ( Pippin ) 十 一 月 (Nov) 


图 7-19 ”苹果 的 收获 月 份 
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Delicious Oct 
GrannySmith Aug 
Jonathan Sep 
McIntosh 0ct 
Gravenstein Sep 
Pippin Nov 














图 7-20 “Harvest 数组 


7.8.4 ”函数 的 散 列 表 表 示 


我 们 可 以 将 属于 某 函 数 的 有 序 对 存储 在 散 列 表 中 。 关 键 的 是 ， 我 们 只 对 定义 域 的 元 素 应 用 
散 列 函数 ， 以 确定 有 序 对 所 属 的 散 列表 元 。 形 成 散 列表 元 的 链表 单元 部 有 一 个 表示 定义 域 元 素 
的 字段 ， 而 男 一 字段 表示 对 应 的 值 域 元 素 ， 第 三 个 字段 则 是 将 链表 中 的 一 个 单元 链接 到 下 一 个 
单元 。 下 面 举 个 例子 ， 应 该 就 能 把 这 个 技巧 说 清 了 。 


+ 示例 7.27 

我 们 继续 使 用 示例 7.26 中 有 关 苹 果 的 数据 ， 不 过 现在 要 使 用 实际 名 称 来 表示 定义 域 。 要 表 
示 图 数 Harvest, 我 们 会 使 用 含 5 个 散 列 表 元 的 散 列 表 。 这 里 要 将 APPLES 定 义 为 32 字 符 的 数组 ， 
而 MONTHS 还 是 示例 7.26 中 那样 的 枚 举 。 散 列表 元 是 链表 ， 具 有 表示 APPLES 类 型 定义 域 元 素 的 
variety 字 段 、 表 示 int 类 型 (月份 ) 值 域 元 素 的 harvesteq 字 段 ， 以 及 指向 链表 中 下 个 元 素 
的 链接 字段 next。 

我 们 会 使 用 与 7.6 闻 中 图 7-11 类 似 的 散 列 函数 h。 当 然 ，h 只 会 应 用 到 定义 域 元 素 上 ， 也 就 是 
说 ， 只 会 应 用 到 由 苹果 品种 名 组 成 的 长 32 个 字符 的 字符 串 上 。 

现在 ， 可 以 将 类 型 HASHTABLE 定 义 为 B 个 LIST 组 成 的 数组 。 其 中 B 是 散 列 表 元 的 数量 ,我 















































们 已 经 将 其 定 为 5 了 。 所 有 这 些 声明 都 出 现在 图 7-22 的 开头 。 然 后 就 可 以 声明 散 列 表 Harvest 
来 表示 所 需 的 函数 。 


Harvest 


McIntosh 














图 7-21 存储 在 散 列 表 中 的 苹果 品种 名 称 及 其 收获 月 份 
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在 搬入 图 7-19 中 列 出 的 6 个 苹果 品种 之 后 ， 散 列表 元 中 单元 的 分 布 如 图 7-21 所 示 。 例 如 ， 如 
果 将 单词 Delicious 的 9 个 字符 对 应 的 整数 值 加 起 来 ， 就 得 到 929。 因 为 929 除 以 5 的 余数 为 4， 
所 以 美味 苹果 (Delicious ) 就 属于 4 号 散 列 表 元 。 而 表示 该 苹果 品种 的 单元 将 字符 串 Delicious 
存放 在 variety 字 段 中 , 将 月 份 0ct 存 放 在 harvested 字 上 段 中 , 最 后 还 有 一 个 指向 散 列 表 元 中 

















下 一 个 单元 的 指针 。 








#include <string.h> 
#define B 5 


typedef char APPLES[32]; 


enum MONTHS {Unknown, Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, 


Sep, Oct, Nov, Dec}; 
typedef struct CELL *LIST; 
struct CELL 荆 

APPLES variety; 
int harvested., 
LIST next,; 
}; 
typedef LIST HASHTABLE[B] ; 


int lookupBucket (APPLES a, LIST L) 


{ 
if (L == NULL) 
return Unknown ; 
if (Istrcmp(a, L->variety)) /* 找到 */ 
return L->harvested; 
else /* 未 找到 a， 检查 尾部 */ 
return lookupBucket (a, L->next); 
} 
int lookup(APPLES a, HASHTABLE H) 
{ 
return lookupBucket (a, H[Lh(a)]); 
} 








图 7-22 ”用 于 通过 散 列 表 表 示 的 函数 的 查找 


7.8.5 ”对 用 散 列 表 表 示 的 函数 的 操作 


要 执行 插入 、 删 除 和 查找 操作 ， 都 要 从 需要 散 列 的 定义 域 值 从 而 找到 散 列 表 元 开始 。 要 插 
入 有 序 对 (a,5) ， 就 要 找到 散 列 表 元 h(a)， 并 查找 它 对 应 的 链表 。 接 下 来 的 操作 就 和 图 7-18 中 给 


出 的 向 链表 搬入 函数 有 序 对 的 函数 一 样 了 。 


要 执行 aelete(a) ， 先 要 找到 散 列 表 元 h(a)， 查 找 具 有 定义 域 值 4 的 单元 ， 要 是 找到 这 样 的 
单元 ， 就 从 链表 中 删除 该 单元 。 而 执行 1ookup(a) 操 作 还 是 要 散 列 a， 然 后 在 散 列 表 元 h(a) 中 查找 


含有 定义 域 值 4 的 单元 。 如 果 找 到 这 样 的 单元 ， 就 会 返回 与 之 
例如 如 图 7-22 所 示 的 函数 1ookup (a,H) 。 国 数 1ookup: 


对 应 的 值 域 值 。 
Bucket (a, Ll) 会 沿 着 与 基 散 列表 





元 对 应 的 链表 向 下 查找 , 并 返回 值 harvested (a), 也 就 是 苹果 品种 收获 的 月 份 。 如果 这 一 月 


份 是 未 定义 的 ， 就 返 回 值 Unknown。 
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向 量 和 散 列 表 


示例 7.26 和 示例 7.27 中 看 待 有 关 革 果 的 信息 的 方式 有 着 根本 的 区 别 。 在 特征 向 量 法 中 ， 蔷 
果品 种 是 个 固定 集 ， 是 枚 举 类 型 的 。 当 C 语 言 程 序 正 在 运行 时 ， 是 没 办 法 改变 苹果 名 称 集合 的 ， 
而 且 对 一 个 未 出 现在 枚 举 集 合 中 的 名 称 执行 查找 也 是 没 意 义 的 。 

另 一 方面 ， 当 我 们 用 散 列 表 来 构建 同一 函数 时 ， 是 将 苹果 名 称 作为 字符 串 ， 而 不 是 枚 举 类 
型 的 数字 。 这 样 一 来 ， 就 有 可 能 在 程序 正在 运行 时 对 名 称 集合 进行 修改 了 ， 比 方 说 是 为 了 响应 
某 些 与 新 的 苹果 品种 有 关 的 输入 数据 。 对 散 列 表 中 未 出 现 的 品种 执行 查找 是 可 行 的 ,而 且 我 们 
必须 有 所 防备 ,要 加 上 Unknown 这 样 一 个 “月 份 ”， 以 防 出 现 查 找 散 列表 中 未 提 及 品种 的 情况 。 
因此 ， 散 列表 的 灵活 性 要 比特 征 向 量 更 佳 ， 不 过 要 付出 一 些 速 度 上 的 代价 。 





7.8.6 ”函数 操作 的 效率 


对 以 我 们 在 本 节 中 讨论 过 的 这 3 种 方式 表示 的 函数 执行 各 种 操作 所 需 的 时 间 ， 与 对 词典 执 
行 同样 操作 所 需 的 时 间 是 一 样 的 。 也 就 是 说 ， 如 果 函 数 由 n 个 有 序 对 组 成 ， 那 么 链表 表示 下 每 
种 操作 平均 需要 O(n) 的 时 间 。 特 征 向 量 法 每 种 操作 只 需要 0() 的 时 间 ， 不过， 就 像 词典 那样 ， 
只 有 定义 域 类 型 的 大 小 比较 有 限时 ， 才 能 使 用 该 表示 法 。 而 具有 B 个 散 列 表 元 的 散 列 表 每 种 操 
作 的 平均 时 间 是 0(n8) 。 如 果 有 可 能 让 8 接近 n， 那 么 就 可 以 达到 每 种 操作 平均 花费 O00) 时 间 
的 水 平 。 


7.8.7 习题 


(1) 模仿 图 7-18 中 的 ijnsert 函 数 ， 编 写 函 数 ， 对 用 链表 表示 的 函数 执行 (a) 删 除 ; (b) 查 找 操作 。 

(2) 编写 函数 ， 对 用 向 量 表示 的 函数 ， 也 就 是 由 DTYPE 类 型 的 整数 作为 下 标的 RTYPE 类 型 的 数组 ， 执 
行 (a) 桂 入 ; (b) 删 除 和 (c) 查 找 操作 。 

(3) 模仿 图 7-22 中 的 lookup 函 数 ， 编 写 函 数 ， 对 用 散 列 表 表 示 的 函数 执行 (a) 插 入 ; (b) 查 找 操作 。 

(4) 二 叉 查 找 树 也 可 用 来 表示 作为 数据 的 函数 。 为 二 叉 查 找 树 定义 合适 的 数据 结构 ， 以 存放 图 7-19 中 
的 苹果 信息 ， 并 使 用 这 些 数 据 结 构 实 现 (a) 插 入 ; (b) 删 除 ; (c) 查 找 操作 。 

(5) 设计 一 个 信息 检索 系统 , 记录 有 关 棱 球 球员 击 球 和 击 中 的 信息 。 所 设计 的 系统 应 该 接受 形 如 Ruth 
5 2 的 三 元 组 ， 表 示 Ruth 在 5 次 击 球 中 击 中 了 2 次 。 对 应 Ruth 的 数据 项 应 该 得 到 适当 的 更 新 。 大 家 
应 该 还 能 查询 任意 球员 的 击 球 次 数 和 击 中 次 数 。 实 现 该 系统 ， 使 得 只 要 执行 插入 和 查找 操作 的 函 
数 使 用 了 合适 的 子 程序 和 类 型 ， 就 对 任意 数据 结构 都 有 效 。 


7.9 二 元 关系 的 实现 


二 元 关系 的 实现 与 图 数 的 实现 有 些许 差异 。 回 想 一 下 , 二 元 关系 与 图 数 都 是 有 序 对 的 集合 ， 
不 过 在 函数 中 , 对 定义 域 中 的 各 元 素来 说 , 最 多 只 能 与 任 一 值 域 元 素 5 构 成 一 个 形 如 (a,5) 的 有 
序 对 。 而 二 元 关系 则 不 同 ， 可 以 有 任意 数量 的 值 域 元 素 与 某 个 给 定 的 定义 域 元 素 a 相 关联 。 

在 本 节 中 ， 我 们 首先 会 考虑 二 元 关系 的 插入 、 删 除 和 查找 操作 的 意义 。 然 后 看 看 已 经 用 到 
的 3 种 实现 一 一 链表 、 特 征 向 量 和 散 列 表 一 一 是 如 何 一 般 化 到 二 元 关系 上 的 。 在 第 8 章 中 ， 我 们 
会 讨论 多 元 关系 的 实现 。 通 常 ， 表 示 多 元 关系 的 数据 结构 ， 都 是 构建 在 表示 函数 和 二 元 关系 的 
数据 结构 的 基础 之 上 的 。 
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7.9.1 对 二 元 关系 的 操作 


当 我 们 将 有 序 对 (a,5) 持 入 二 元 关系 R 中 时 ， 并 不 需要 关心 R 中 是 否 已 经 存在 菜 个 有 序 对 
(a,5b) ， 其 中 cb ， 但 癌 某 个 函数 中 插入 (a,b) 时， 就 需要 关心 这 个 了 。 原 因 当 然 是 R 中 包含 定 
义 域 值 4 的 有 序 对 数量 是 没有 限制 的 。 因此, 可 以 直接 将 有 序 对 (a,5) 持 入 R 中 ,就 像 将 元 素 捅 入 
任意 集合 中 那样 。 

同样 ， 从 关系 中 删除 有 序 对 (a,5) 也 类 似 于 从 集合 中 删除 元 素 : 要 查找 该 有 序 对 ， 如 果 存 在 
就 将 其 删除 。 

查找 操作 可 以 用 多 种 方式 定义 。 例 如 , 我 们 可 以 接受 有 序 对 (a,b) ,并 询问 该 有 序 对 是 否 在 
KR 中。 不过， 如 有 果 我 们 因此 将 对 关系 的 查找 操作 解释 成 与 刚 定义 的 插入 和 删除 操作 那样 ， 与 对 
任意 词典 的 这 些 操 作 行为 相同 ， 被 操作 的 元 素 是 有 序 对 而 不 是 原子 这 一 事实 就 只 是 个 小 细 市 ， 

它 只 能 影响 到 词典 中 元 素 的 类 型 。 

然而 ,定义 lookup 来 接受 定义 域 元 素 g,， 并 返回 所 有 满足 (a,5) 在 二 元 关系 R 中 的 值 域 元 素 b 
往往 是 很 实用 的 。 对 1ookup 的 这 种 解释 给 了 我 们 一 种 与 词典 有 所 区 别 的 抽象 数据 类 型 ， 它 有 着 
与 词典 ADT 不 同 的 某 些 特定 用 途 。 


+ 示例 7.28 

大 多 数 李子 品种 需要 另 一 种 特定 的 品种 来 传粉 , 没有 合适 的 “传粉 者 ”, 这 棵 李 树 就 不 会 结 
果 。 有 少数 品种 是 “ 自 育 的 "， 也 就 是 说 它们 可 以 作为 自己 的 传粉 者 。 图 7-23 展 示 了 李子 品种 集 
合 上 的 二 元 关系 。 这 一 关系 中 的 有 序 对 (a,b) 表明 品种 5 是 品种 a 的 传粉 者 。 

将 有 序 对 插入 该 表 表 示 断 言 某 个 品种 是 另 一 个 品种 的 传粉 者 。 例 如 ， 如 果 培 育 出 新 品种 ， 
就 可 能 要 向 该 关系 中 输入 与 可 以 给 该 新 品种 传粉 的 品种 以 及 可 以 被 它 传 粉 的 品种 有 关 的 事实 。 
删除 某 个 有 序 对 ， 就 表示 收回 某 个 品种 可 为 男 一 品种 传粉 的 断言 。 












































品 种 传粉 者 
美丽 ( Beauty ) 圣 罗 莎 ( Santa Rosa ) 
圣 罗 莎 ( Santa Rosa ) 圣 罗 莎 (Santa Rosa ) 
伯 班 克 ( Burbank ) 美丽 (Beauty ) 
伯 班 克 ( Burbank ) 圣 罗 水 (Santa Rosa ) 
澳 得 罗 达 (Eldorado ) 圣 罗 莎 (Santa Rosa ) 
澳 得 罗 达 ( Eldorado ) 威 克 森 ( Wickson ) 
威 克 森 ( Wickson ) 圣 罗 水 ( Santa Rosa ) 
威 克 森 ( Wickson ) 美丽 (Beauty ) 





图 7-23” 某 些 李子 品种 的 传粉 者 





对 关系 更 一 般 的 操作 


除了 对 示例 7.28 中 的 李子 品种 进行 插入 、 删 除 和 查找 这 3 种 操作 可 以 提供 的 信息 之 外 ， 我 
们 可 能 还 需要 更 多 的 信息 。 例如， 我 们 可 能 想 问 ,“ 圣 罗 莎 可 以 为 哪些 品种 传粉 ”或 者 “ 澳 
得 罗 达 能 否 给 美丽 传粉 ” 某 些 数据 结构 ， 比 如 链表 ， 让 我 们 能 以 执行 这 3 种 基本 词典 操作 的 
速度 回答 这 样 的 问题 ， 只 要 不 是 链表 对 这 些 操作 很 低 效 。 
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基于 定义 域 元 素 的 散 列 表 无 助 于 回答 给 定 了 值 域 元 素 并 必须 找到 对 应 定义 域 元 素 的 问题 ， 
例如 ,“ 圣 罗 莎 可 以 为 哪些 品种 传粉 ? ”当然 ， 可 以 对 值 域 元 素 应 用 散 列 函数 ， 不 过 这 样 一 来 
就 不 好 回答 “什么 品种 可 以 给 伯 班 克 传 粉 ” ”这 样 的 问题 了 。 还 可 以 对 定义 域 元 素 和 值 域 元 素 
的 组 合 应 用 散 列 函数 ,不 过 这 样 一 来 对 哪 种 类 型 的 查询 都 不 能 高 效 响应 了 ， 只 能 回答 一 些 类 似 
“ 澳 得 罗 达 能 否 给 美丽 传粉 ”这 样 的 简单 问题 。 

有 多 种 方式 能 高 效 地 回答 所 有 这 些 类 型 的 问题 。 不 过 ， 我 们 要 等 到 第 8 章 谈 论 关系 模型 时 
才 会 了 解 到 这 些 技 巧 。 





我 们 定义 的 查找 操作 接受 变量 a 作为 参数 ， 查 看 第 一 列 ， 寻 找 所 有 包含 值 a 的 有 序 对 ， 并 返回 
与 之 关联 的 值 域 值 集合 。 也 就 是 说 ， 询 问 “ 哪 个 品种 可 以 给 品种 a 传粉 ” ”该 问题 似乎 是 最 可 能 
询问 的 与 该 表 有 关 的 信息 ， 因 为 如 果 我 们 种 植 了 一 棵 李 树 ， 就 必须 确认 ， 如 果 它 不 是 自 育 的 ， 就 
应 该 在 附近 种 植 传粉 者 。 例如 , 如 果 调 用 lookup (Burbank), 预期 答案 就 是 {Beauty, Santa Rosa}。 


7.9.2 ”二 元 关系 的 链表 实现 


如 果 愿 意 的 话 ， 我 们 可 以 将 关系 中 的 有 序 对 在 链表 中 链接 起 来 。 该 链表 的 单元 都 含有 一 个 
定义 域 元 系 、 一 个 值 域 元 素 , 以 及 一 个 指向 下 一 个 单元 的 指针 ,就 像 表 示 哺 数 的 链表 单元 那样 。 
插入 和 删除 操作 ， 就 像 6.4 节 中 讨论 过 的 针对 一 般 集合 的 插入 和 删除 那样 。 唯 一 的 小 差别 就 是 这 
里 集合 成 员 的 相等 性 ， 是 通过 比较 存放 定义 域 元 素 的 字段 以 及 存放 值 域 元 素 的 字段 确定 的 。 

这 里 的 查找 操作 要 与 我 们 之 前 遇 到 的 查找 操作 有 些 不 同 。 我 们 必须 沿 着 链表 向 下 ， 查 找 含 
某 个 特定 定义 域 值 4 的 单元 , 而 且 必 须 将 与 之 相关 的 值 域 值 组 成 一 个 链表 。 下 面 的 示例 将 会 展示 
对 链表 进行 查找 操作 的 机 制 。 


+ 示例 7.29 
假设 我 们 想 用 链表 来 实现 示例 7.28 中 的 李子 关系 ,可 以 将 RVARIETY 类 型 定义 为 长 32 个 字符 


的 字符 串 ， 并 将 类 型 为 RCELL ( relation cell， 关 系 单元 ) 的 单元 定义 为 结构 体 
typedef char PVARIETY[32] ; 
typedef struct RCELL *RLIST; 
struct RCELL { 
PVARIETY Variety; 
PVARIETY pollinizer; 



































RLIST next; 
}; 
我 们 还 需要 一 个 单元 容纳 一 个 李子 品种 和 指向 下 一 个 单元 的 指针 ， 以 构建 某 给 定 品种 传粉 者 的 
链表 ， 并 以 此 来 回应 lookup 查 询 。 我 们 将 该 类 型 称 为 PCELL， 并 定义 


typedef struct PCELL *PLIST; 

struct PCELL 1{ 

PVARIETY pollinizer; 
PLIST next; 

}; 
然后 可 以 通过 图 7-24 中 的 函数 定义 查找 操作 。 

消 数 lookup 接 受 定义 域 元 素 a 和 指 问 有 序 对 链表 第 一 个 单元 的 指针 作为 参数 。 通 过 调用 
lookup (a, 工 ) ， 可 以 对 关系 R 执 行 ]ookup (a) 操 作 ， 这 里 的 L 是 指 癌 表 示 关 系 R 的 链表 第 一 个 单 
元 的 指针 。 第 (1) 行 和 第 (2) 行 都 很 简单 。 如 果 链 表 为 空 ， 就 返回 NULL， 因 为 在 空 链表 中 不 存在 
第 一 个 组 分 为 a 的 有 序 对 。 
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PLIST lookup(PVARIETY a, RLIST L) 
{ 
PLIST P: 


(1) if (L == NULL) 

(2) return NULL ; 

(3) else if (!Istrcmp(L->variety, a)) /* L->variety == a */ { 
(4) P = (PLIST) malloc (sizeof (struct PCELL) ) ; 

(5) strcpy(P->pollinizer, L->pollinizer); 

(6) P->next = lookup(a, L->next); 

(7) return P; 


} 
else /* a 不 是 当前 数 对 的 定义 域 值 */ 
(8) return lookup(a, L->next); 











图 7-24 ”在 用 链表 表示 的 二 元 关系 中 进行 查找 


难题 就 是 在 链表 第 一 个 单元 的 定义 域 字段 variety 中 找到 a 的 情况 。 这 种 情况 是 在 第 (3) 行 
检测 , 在 第 (4) 行 至 第 (07) 行 得 到 处 理 的 。 我们 在 第 (4) 行 创建 一 个 PCELL 类 型 的 新 单元 , 这 将 成 为 
我 们 要 返回 的 PCELL 链 表 中 的 第 一 个 单元 。 第 (5) 行 会 将 相关 联 的 值 域 值 复制 到 新 单元 中 。 然 后 
在 第 (6) 行 我 们 会 对 链表 Z 的 尾部 递归 地 调用 lookup。 该 调用 的 返回 值 是 指向 得 到 的 链表 中 第 一 
个 单元 的 指针 ( 如 果 链 表 为 空 则 是 NULL )， 它 会 成 为 我 们 在 第 (4) 行 中 所 创建 单元 的 next 字 段 。 
然后 第 (7) 行 要 返回 指向 新 创建 单元 的 指针 ， 该 单元 存放 着 对 应 定义 域 值 的 一 个 值 域 值 ， 而 且 
如 果 存 在 对 应 a 的 其 他 值 域 值 ， 该 单元 还 将 链接 到 存放 其 他 值 域 值 的 单元 。 

最 后 一 种 情况 是 没有 在 链表 ZL 的 第 一 个 单元 中 找到 所 需 的 定义 域 值 a。 这 时 只 要 在 第 (8) 行 对 
链表 7 的 尾部 调用 lookup， 并 返回 该 调用 返回 的 任何 内 容 即 可 。 


7.9.3 ”特征 问 量 法 


我 们 看 到 ， 对 于 集合 与 函数 ， 可 以 通过 创建 以 某 个 “全 集 ” 的 元 素 为 索引 的 数组 ， 并 在 数 
组 中 放置 合适 的 值 来 表示 这 些 和 集合 与 函数 。 对 集合 来 说 ,合适 的 数组 值 就 是 TRUE 和 FALSE， 而 
对 函数 而 言 ， 就 是 那些 可 以 出 现在 值 域 中 的 值 ， 通 常 还 要 加 上 表示 “无 ”的 特殊 值 。 

对 二 元 关系 来 说 ， 可 以 通过 某 个 较 小 的 声明 定义 域 中 的 成 员 作为 数组 的 索引 ， 就 像 处 理 函 
数 时 那样 。 不 过 ， 不 能 使 用 单个 值 作为 数组 元 素 ， 因 为 在 二 元 关系 中 ， 对 于 某 个 给 定 的 定义 域 
值 ， 可 能 有 任意 数量 的 值 域 值 与 之 对 应 。 最 好 是 把 与 某 给 定 定义 域 值 相关 联 的 所 有 值 域 值 存 人 
一 个 链表 ， 然 后 将 该 链表 的 表 头 作为 数组 的 元 素 。 


+ 示例 7.30 
我 们 用 这 种 组 织 方式 再 来 处 理 李 子 品种 的 例子 。 正 如 我 们 在 7.8 节 中 指出 的 ,在 使 用 特征 疝 
量 表示 法 时 ， 必 须 让 值 的 集合 固定 不 变 ， 至 少 要 保证 定义 域 值 的 集合 不 变 ， 而 对 链表 或 散 列 表 
的 表示 而 言 ， 就 不 存在 这 种 限定 。 因 此 ， 必 须 重 新 将 PVARIETY 类 型 声明 为 枚 举 类 型 
enum PVARIETY {Beauty, SantaRosa, Burbank, Eldorado, Wickson}; 
我 们 可 以 继续 使 用 示例 7.29 中 定义 的 表示 品种 链表 的 PCELL 类 型 ， 这 样 就 可 以 将 数组 定义 为 
PLIST Pollinizers[5]; 


也 就 是 说 ， 表 示 图 7-23 所 示 关 系 的 数组 ， 是 用 该 图 中 提 及 的 品种 作为 索引 的 ， 而 与 每 个 品种 关 
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联 的 值 , 都 是 指向 其 传粉 者 链表 第 一 个 单元 的 指针 。 图 7-25 展 示 了 用 特征 向 量 法 表示 出 的 图 7-23 
中 的 有 序 对 。 


Pollinizers 
















Beauty 


ETI 







SantaRosa | SantaRosa | 。 | 

Burbant By | mono || 
Baorad EYE 
Wideon Boy | el ono | 


图 7-25 ”传粉 者 关系 的 特征 向 量 表示 


要 执行 有 序 对 的 插入 和 删除 ， 先 要 找到 恰当 的 数组 元 素 ， 并 从 那里 开始 沿 着 链表 行进 。 至 
此 , 链表 的 插入 和 删除 操作 就 很 平 党 了。 例如， 如 有 果 我 们 确定 威 克 条 不 能 充分 给 澳 得 罗 达 传粉 ， 
就 可 以 执行 aelete(Eldqorado,Wickson) 操 作 。 对 应 Eldorado 的 链表 表 头 在 Pollinizers 
[Eldorado] 中 被 找到 , 而 且 要 从 那里 开始 沿 着 链表 癌 下 行进 , 直到 找到 存放 Wickson 的 单元 并 
将 其 删除 。 

查找 操作 更 是 小 菜 一 碟 ， 只 需要 返回 在 合适 的 数组 条 目 中 找到 的 指针 。 例 如 ， 要 对 查询 
lookup (Burbank,Pollinizers) 作 出 回应 ， 只 要 返回 链表 Pollinizers[Burbank] 就 
so 


7.9.4 二 元 关系 的 散 列表 表示 


我 们 可 以 使 用 只 取决 于 有 序 对 第 一 个 组 分 的 散 列 函数 ， 将 给 定 的 二 元 关系 R 存 储 在 散 列 表 
中 。 也 就 是 说 ， 有 序 对 (a,5) 会 被 放置 在 散 列 表 元 h(a) 中 ， 其 中 h 是 散 列 函数 。 请 注意 ,这 种 安排 
与 针对 函数 的 安排 是 一 模 一 样 的 ， 唯 一 的 差异 在 于 ， 对 二 元 关系 而 言 ， 一 个 散 列 表 元 中 可 能 
含 多 个 以 给 定 的 值 w 作 为 第 一 个 组 分 的 有 序 对 ,而 对 函数 而 言 , 它 所 含 的 这 种 有 序 对 决 不 会 超过 


ss 


站。 

要 插入 有 序 对 (a,5b) , 就 要 计算 h(a) , 并 对 含有 该 成 员 的 散 列 表 元 加 以 检查 , 以 确保 (a,5) 疯 
未 出 现在 其 中 。 如 果 还 没 出 现 ， 就 将 (a,5) 添 加 到 该 散 列 表 元 对 应 链表 的 末端 。 要 删除 (a,5) ， 
就 要 先 找到 散 列 表 元 h(a)， 然 后 查找 该 有 序 对 ， 如 果 链 表 中 存在 该 有 序 对 ， 就 将 其 删除 。 

要 执行 ]ookup (a), 就 还 是 要 先 找到 散 列 表 元 h(a), 然后 沿 着 该 散 列 表 元 对 应 的 链表 问 下 行 
进 ,收集 所 有 在 第 一 个 组 分 为 a 的 单元 中 出 现 的 5p。 图 7-24 中 为 二 元 关系 的 链表 表示 编写 的 lookup 
函数 也 可 以 用 于 构成 散 列 表 表 元 的 链表 。 


7.9.5 ”二 元 关系 操作 的 运行 时 间 


二 元 关系 3 种 表示 的 性 能 与 函数 或 词典 上 同样 结构 的 性 能 差别 不 大 。 首先 考虑 链表 表示 。 尽 
管 还 没有 编写 过 用 于 插入 和 删除 操作 的 函数 ， 但 我 们 应 该 能 意识 到 这 些 函 数 会 行 遍 整 个 链表 ， 
查找 目标 有 序 对 , 然后 在 找到 它 的 地 方 停 下 。 在 长 度 为 n 的 链表 上 , 这 样 的 查找 平均 会 耗费 O(n) 
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的 时 间 ， 因 为 如 果 没 找到 这 样 的 有 序 对 ， 它 肯定 是 扫描 了 整个 链表 ， 而 如 果 找 到 了 ， 它 平均 也 
要 扫描 链表 的 半数 单元 。 

对 查找 操作 来 说 ， 图 7-24 中 的 检测 应 该 能 说 服 我 们 ,该 函数 所 花 的 时 间 是 0() 加 上 对 链表 
尾部 的 递归 调用 耗费 的 时 间 。 因 此 ， 如 有 果 链 表 长 度 为 x， 我 们 会 执行 n 次 调用 ， 总共 花费 O(n) 的 
时 间 。 

现在 考虑 一 般 化 的 特征 向 量 。 操 作 1ookup (a) 是 最 简单 的 。 找 到 以 a 为 下 标的 数组 元 素 ， 可 
以 在 该 元 素 处 找到 所 需 的 答案 一 一 满足 有 序 对 (a,5) 在 该 关系 中 的 所 有 5b 组 成 的 链表 。 我 们 其 至 
不 必 检 验 这些 元 素 或 复制 它们 。 因 此 ， 在 使 用 特征 向 量 时 ， 查 找 操作 花 的 时 间 为 0(1) 。 

男 一 方面 ， 插 入 和 删除 操作 就 没 那 么 简单 了 。 要 插入 (a,b) ， 可 以 相当 容易 地 找到 下 标 为 a 
的 数组 元 素 ， 不 过 必须 查找 整个 链表 ， 以 确保 (a,5b) 尚 未 出 现在 其 中 。" 这 样 做 所 需 的 时 间 与 链 
表 的 平均 长 度 成 比例 ， 也 就 是 说 ， 与 关联 某 给 定 定 义 域 值 的 值 域 值 的 平均 数量 成 正比 。 我 们 将 
该 参数 称 为 m。 男 一 种 看 竺 m 的 方式 是 , 它 是 关系 中 有 序 对 的 总 数量 n 除 以 不 同 定义 域 值 的 数量 。 
如 果 假 设 任 一 链表 与 其 他 链表 被 查找 的 可 能 都 是 相同 的 , 则 执行 插入 或 删除 操作 平均 需要 O(m) 
的 时 间 。 

最 后 来 考虑 散 列 表 。 如 果 在 关系 中 有 n 个 有 序 对 ， 并 且 散 列表 中 有 B 的 散 列 表 元 ， 就 能 预期 
平均 每 个 散 列 表 元 中 有 n/8 个 有 序 对 。 不 过 ， 这 里 还 是 要 引入 参数 m。 如 有 果 存 在 n/m 个 不 同 的 害 
义 域 值 , 那么 至 多 有 n/m 个 散 列 表 元 可 以 是 非 空 的 , 因为 对 应 有 序 对 的 散 列 表 元 只 由 定义 域 值 决 
定 。 因 此 ,不 管 3 是 多 少 ，m 是 散 列 表 元 平均 大 小 的 下 界 。 因 为 n/8 也 是 下 界 ， 所 以 执行 这 3 种 操 
作 其 中 之 一 所 花 的 时 间 是 0 (max(m,n/B))。 




















+ 示例 7.31 

假设 有 一 个 含 1000 个 有 序 对 的 关系 , 这 些 有 序 对 分 布 到 100 个 定义 域 值 中 。 那么 每 个 定义 域 
值 会 有 10 个 值 域 值 与 之 关联 ， 也 就 是 说 m = 10。 如 果 使 用 1000 个 散 列 表 元 ， 也 就 是 8= 1000， 那 
么 m 要 大 于 n/B, 也 就 是 1, 这 样 就 可 以 预期 我 们 实际 可 能 查找 的 散 列 表 元 ( 因为 表 元 编号 为 h(a)， 
其 中 a 是 关系 中 的 某 个 定义 域 值 ) 平均 含有 约 10 个 有 序 对 。 事实 上 , 每 个 散 列 表 元 中 平均 所 含有 
序 对 数量 要 略 多 于 这 个 值 ， 因 为 不 同 的 定义 域 值 a,/ 和 4, 在 经 过 散 列 之 后 ， 得 到 的 h(a1) 和 h(as) 可 
能 恰巧 是 同一 个 散 列 表 元 。 如 果 选 择 B= 100， 那么 m =WB = 10， 还 是 可 以 预期 每 个 可 能 查找 的 
散 列 表 元 含有 约 10 个 元 素 。 正 如 刚刚 提 到 的 ， 实 际 数字 可 能 要 上 略 大 于 10， 因 为 可 能 出 现 两 个 或 
多 个 定义 域 值 散 列 到 同一 散 列 表 元 的 巧合 。 


7.9.6 ”习题 


(1) 使 用 示例 7.29 中 的 数据 类 型 编写 孔 数 ,接受 传粉 者 的 值 5 以 及 由 品种 -传粉 者 有 序 对 组 成 的 链表 作 
为 参数 ， 并 返回 由 可 以 被 2 传粉 的 品种 组 成 的 链表 。 

(2) 使 用 示例 7.29 中 的 假设 ， 编 写 用 来 处 理 品 种 -传粉 者 有 序 对 的 (a) 插 入 ; (b) 删 除 程序 。 

(3) 为 用 示例 7.30 所 述 的 向 量 数据 结构 表示 的 二 元 关系 编写 执行 (a) 插 入 ; (b) 删 除 ; (c) 查 找 操作 的 函数 。 
在 插 和 人 有 序 对 时 ， 不 要 忘 了 检查 相同 的 有 序 对 是 否 已 经 出 现在 该 关系 中 。 

(4) 设计 散 列 表 数 据 结构 ， 用 来 表示 构成 本 节 中 大 量 示 例 的 传粉 者 关系 。 编 写 执行 插入 、 删 除 和 查找 
操作 的 函数 。 





























J 也 可 以 在 不 考虑 该 有 序 对 是 否 已 经 出 现 的 情况 下 直接 插入 该 有 序 对 ,不 过 这 样 就 会 同时 带 来 6.4 节 中 讨论 过 的 允 
许 重复 的 链表 表示 所 具有 的 优点 和 缺点 。 
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(5)* 通过 对 链表 世 的 长 度 进 行 归纳 , 证 实 lookup 返 回 了 满足 有 序 对 (a,5) 在 L 中 的 所 有 元 素 5 组 成 的 链 
表 ， 从 而 证 明 图 7-24 中 的 lookup 函 数 可 以 正常 工作 。 

(6)* 设计 数据 结构 ， 使 其 执行 插入 、 删 除 、 查 找 和 反 向 查找 ( inverseLookup ) 操作 的 平均 时 间 可 
以 达到 OO 的 水 平 。 反 向 查找 操作 是 接受 值 域 元 素 ， 并 找到 与 之 关联 的 定义 域 元 素 。 

(7) 在 本 节 以 及 前 面 的 几 节 中 , 我 们 定义 了 一 些 具 有 插入 、 删 除 和 查找 操作 的 新 抽象 数据 类 型 。 不 过 ， 
这 些 操 作 与 对 词典 的 同名 操作 稍 有 差异 。 绘 制 表格 ,分 别 记 下 词典 、 函 数 ( 如 7.8 节 所 描述 ) 和 关 
系 ( 如 本 节 所 描述 ) 可 能 的 抽象 实现 ， 以 及 支持 这 些 抽象 实现 的 数据 结构 。 对 每 种 实现 ， 给 出 各 
操作 的 运行 时 间 。 

















对 函数 和 关系 的 “词典 操作 ” 
有 序 对 的 集合 可 以 视 为 集合 、 函 数 或 是 关系 。 对 每 种 情况 来 说 ， 我 们 都 已 经 定义 了 合适 的 插入 、 删 
除 和 查找 操作 。 这 些 操 作 有 着 不 同 的 形式 。 多 数 情 况 下 ， 操 作 会 同时 取 有 序 对 的 定义 域 元 素 和 值 域 元 素 。 
不 过 ， 有 时 候 只 有 定义 域 元 素 被 用 作 参 数 。 下 表 总 结 了 这 3 种 操作 在 使 用 中 的 差异 。 


有 序 对 集合 函 数 关 系 
插入 定义 域 和 值 域 定义 域 和 值 域 定义 域 和 值 域 
删除 定义 域 和 值 域 仪 定义 域 定义 域 和 值 域 
查找 定义 域 和 值 域 仪 定义 域 仪 定义 域 





7.10 二 元 天 系 的 一 些 特殊 属性 


在 本 节 中 ， 我 们 将 考虑 某 些 实用 的 二 元 关系 所 具备 的 一 些 特殊 属性 。 首 先 要 定义 一 些 基本 
属性 : 传递 性 、 自 反 性 、 对 称 性 与 反对 称 性 。 这 些 结合 起 来 就 形成 了 几 类 常见 的 二 元 关系 : 偏 
序 关系 、 全 序 关系 和 等 价 关系 。 


7.10.1 传递 性 


设 R 是 定义 域 D 上 的 二 元 关系 。 如 果 只 要 aRb 和 bRc 为 真 ， 就 有 aRc 也 为 真 ， 就 说 关系 R 是 传 
北 的 。 图 7-26 展 示 了 传递 性 这 种 属性 。 就 像 它 在 关系 图 中 出 现 的 那样 ， 只 要 从 a 到 b 以 及 从 b 到 c 
的 虚线 箭头 出 现在 图 中 ， 那 么 从 a 到 c 的 实 线 箭头 也 一 定 会 出 现在 图 中 。 谨 记 ， 传 递 性 与 本 节 中 
要 定义 的 其 他 属性 一 样 , 都 是 关于 整个 集合 的 属性 。 只 有 3 个 特定 的 定义 域 元 素 满 足 该 属性 是 不 
够 的 ， 声 明 的 定义 域 D 中 所 有 的 三 元 组 a、b、c 都 必须 满足 。 


























图 7-26 ”传递 性 成 立 的 条 件 要 求 如 果 aRb 和 bRe 的 弧 在 表示 关系 的 图 中 出 现 ， 那 么 弧 aRc 也 要 出 现 


+ 示例 7.32 
考虑 一 下 整数 集 Z 上 的 < 关系。 也 就 是 说 ，< 是 满足 a 小 于 5 的 整数 有 序 对 (a,b) 的 集合 。3 
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系 < 是 传递 的 ， 因 为 如 果 a<b 且 5<c， 就 可 知 a<c。 同 样 ， 整数 上 的 关系 三 、> 和 三 也 都 是 
传递 的 。 这 4 种 比较 关系 在 实数 集合 上 也 同样 具有 传递 性 。 

不 过 ， 考 虑 一 下 整数 (或 者 是 实数 ) 上 的 # 关 系 。 该 关系 就 不 具 传递 性 。 例 如 ， 设 c 和 c 都 
是 3， 并 设 b 是 5。 这 样 azb 与 zc 都 为 真 。 如 果 该 关系 是 传递 的 ， 那 么 应 该 有 ac 。 不 过 这 
就 是 说 3 3 ， 显 然 是 错 的 。 所 以 可 以 得 出 = 是 不 具 传递 性 的 。 

再 举 个 传递 关系 的 例子 ， 考 虑 一 下 S ， 也 就 是 子 集 关 系 。 我 们 也 许 想 将 该 关系 视 为 所 有 满 
足 $ 为 7 的 子 集 的 集合 有 序 对 (5,7) 组 成 的 集合 ,但 想象 一 下 ， 有 这 样 的 集合 就 会 再 次 将 我 们 引 向 
罗素 悖 论 。 不 过 ,假设 有 “全 集 ”U， 就 可 以 设 5, 是 集合 有 序 对 的 结合 

ty TY SETETSEUT 
那么 s, 就 是 U0 的 窜 集 P(U) 上 的 关系 ， 而 我 们 可 以 将 5S, 当 作 子 集 关 系 。 

例如 ， 设 U= {1,2}。 那 么 S11 就 是 由 如 图 7-27 所 示 的 9 个 (5,7) 有 序 对 组 成 的 。 因 此 ，5, 刚 
好 含有 满足 第 一 个 组 分 是 第 二 个 组 分 的 子 集 (不 一 定 是 真子 集 )， 而 且 二 者 皆 为 {1,2} 的 子 集 的 
那些 有 序 对 。 

不 管 全 集 U 是 什么 ,都 很 容易 检验 S, 是 传递 的 ,如 果 4SB 而 且 BSC ,那么 肯定 有 4SC 。 
原因 在 于 ,对 4 中 的 每 个 x, 我 们 知道 x 也 在 B 中 ,因为 4S B 。 因 为 x 在 8 中 ,我 们 知道 x 也 在 C 中 ， 
因为 BSC 。 因 此 4 中 的 每 个 元 素 也 都 是 C 中 的 元 素 。 所 以 4SC 。 




















S T 
@ @ 
人 {1} 
他 {2} 
他 {1, 2} 


{1} {1} 
{1} {1, 2} 
{2} {2} 
{2} {1, 2} 
{1 ,2} {1; 2} 








图 7-27 关系 ,中 的 有 序 对 


7.10.2 ” 自 反 性 


有 些 二 元 关系 R 还 具有 这 样 的 属性 ， 就 是 对 声明 的 定义 域 中 的 每 个 元 素 a，R 中 都 包含 有 序 
对 (a,b) ， 也 就 是 都 有 aRa。 如 果 这 样 的 话 ， 就 说 R 是 自 反 的 。 图 7-28 展 示 了 某 自 反 关系 的 图 ， 其 
声明 的 定义 域 中 每 个 元 素 上 都 有 个 循环 。 该 图 中 除了 这 些 循环 外 还 可 能 有 其 他 的 箭头 。 不 过 ， 
当前 定义 域 中 每 个 元 素 都 有 循环 是 不 够 的 ， 必 须 是 声明 定义 域 中 每 个 元 素 都 有 循环 才 行 。 











图 7-28 ”上 自 反 关系 R 对 其 声明 定义 域 中 每 个 元 素 x* 来 说 都 有 xRx 
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+ 示例 7.33 

实数 集合 上 的 关系 三 就 是 自 反 的 。 对 每 个 实数 a 而 言 ， 都 有 a 宇 a。 同 样 ， 志 是 自 反 的 ， 而 
这 两 种 关系 在 整数 集合 上 也 是 自 反 的 。 不 过 ，< 和 > 就 不 是 自 反 的 , 因为 至 少 有 一 个 a 的 值 可 以 
使 a>a 和 a<=a 不 成 立 ， 其实 ， 对 所 有 的 a 来 说 ，a>a 和 a<=a 都 是 不 成 立 的 。 

示例 7.32 中 定义 的 子 集 关 系 9, 也 是 自 反 的 ， 因 为 对 任意 集合 4 而 言 ， 都 有 4S 4 。 不过， 
有 着 相似 定义 ,包含 满足 TSU 和 5S CT 的 有 序 对 (5,7) 的 关系 , 表示 4 是 7 的 真子 集 的 关 
系 一 一 就 不 是 自 反 的 。 原 因 在 于 ，4C 4 对 某 些 4 (事实 上 是 对 所 有 的 4 ) 来 说 不 成 立 。 


7.10.3 ”对 称 性 与 反对 称 性 
设 R 是 某 二 元 关系 。 正 如 7.7 广 的 习题 (7) 所 定义 的 那样 ，R 的 逆 是 指 将 R 中 各 有 序 对 的 组 分 调 
换 位 置 后 形成 的 新 有 序 对 组 成 的 集合 。 也 就 是 说 ，R 的 逆 ， 记 作 R”"， 就 是 
{(b,a)|(a,b) eR} 
例如 ，> 是 < 的 逆 ， 因 为 刚好 当 b<a 时 有 a>4b。 同 样 ， 三 是 < 的 逆 。 


图 7-29 ”对 称 性 要 求 如 果 aRb， 就 也 有 BbRa 


如 有 果 R 是 它 自己 的 逆 ， 就 说 它 是 对 称 的 。 也 就 是 说 ， 如 果 只 要 aRb， 束 也 有 DbRa， 就 说 R 是 对 
称 的 。 图 7-29 展 示 了 在 表示 关系 的 图 中 对 称 性 是 什么 样 的 。 如 果 出 现 了 向 前 的 弧 ， 就 肯定 还 要 
有 癌 后 的 弧 。 

如 有 果 只 有 a=5 在 时 才 有 aRb 和 bRa 都 为 真 ， 我 们 就 说 R 是 反对 称 的 。 请 注意 ， 在 反对 称 关系 
中 ， 都 不 必 有 aRa 对 任意 特定 a 来 说 为 真 。 不 过 ， 反 对 称 关 系 也 可 以 是 自 反 的 。 图 7-30 展 示 了 在 
关系 图 中 反对 称 的 条 件 是 怎样 的 。 
































从 不 可 选 的 
图 7-30 ”反对 称 关系 不 能 具有 涉及 两 个 元 素 的 循环 ， 不 过 单一 元 素 上 的 循环 是 可 以 出 现 的 


+ 示例 7.34 

整数 集 或 实数 集 上 的 硅 关系 就 是 反对 称 的 ， 因 为 ， 如 果 a 三 b 且 4b 三 a ,就 肯定 有 a=。b。 
关系 < 也 是 反对 称 的 ， 因 为 在 任何 条 件 下 a=b 和 b=<a 都 不 可 能 同时 成 立 。 同 样 ， 三 和 > 是 反 
对 称 的 ， 示 例 7.32 中 讨论 的 子 集 关系 5, 也 是 。 

不 过 ， 要 注意 到 志 不 是 对 称 的 。 例 如 ，3 三 5, 但 5 科 3 是 不 成 立 的 。 同 样 ， 上 一 段 中 提 到 
的 其 他 几 种 关系 也 都 不 是 对 称 的 。 

整数 上 的 去 关系 就 是 对 称 关系 的 一 个 例子 。 也 就 是 说 ， 如 果 azb ， 就 一 定 有 ba 。 
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属性 定义 中 的 陷阱 

正如 前 文 已 经 指出 的 ， 属性 的 定义 都 是 针对 一 般 情况 的 ,适用 于 定义 域 中 的 所 有 元 素 。 例 
如 ,要 让 声明 定义 域 D 上 的 菜 关系 R 是 自 反 的 , 就 需要 对 每 个 ae D 都 有 daRa。aRa 对 某 个 ad 成 立 是 
不 够 的 ， 而 且说 某 个 关系 对 菜 些 元 素 自 反而 对 另 一 些 元 素 不 自 反 也 是 说 不 通 的。 就 算 D 中 只 有 
一 个 a 让 aRa 不 成 立 ， 也 说 明 R 不 是 自 反 的 。 因 此 ， 自 反 性 可 能 取决 于 定义 域 ,而且 取决 于 关 
系 R。 

还 有 , 像 传 递 性 一 一 若 aRb 且 bRc, 则 aRc 一 一 这 样 的 条 件 有 具有“ 若 4 则 B” 的 形式 。 请 记 住 ， 
要 满足 这 样 的 命题 ， 既 可 以 让 有 为 真 ， 也 可 以 令 4 为 假 。 因 此 ， 对 某 个 给 定 的 三 元 组 w、D 和 c， 
只 要 adRBb 为 假 ， 或 pRc 为 假 ， 或 aRc 为 真 ， 就 满足 传递 性 的 条 件 。 最 极端 的 情况 是 ， 空 关系 是 传 
递 的 、 对 称 的 而 且 反 对 称 的 ， 因 为 “ 若 ” 的 条 件 从 不 能 满足 。 不 过 ， 空 关系 不 是 自 反 的 ， 除 非 
声明 的 定义 域 为 名。 








7.10.4” 偏 序 和 全 序 


偏 序 是 传递 且 反 对 称 的 二 元 关系 。 如 果 除 了 传递 性 和 反对 称 性 之 外 ， 某 关系 能 让 每 个 定义 
域 元 素 对 都 是 可 比 的 ， 就 说 该 关系 是 全 序 关 系 。 也 就 是 说 ， 如 果 R 是 全 序 的 ， 而 且 a 和 b 是 其 定 
义 域 中 的 任意 两 个 元 素 ， 则 要 么 aRb 为 真 ， 要 么 bRa 为 真 。 请 注意 ， 每 个 全 序 关 系 都 是 自 反 的 ， 
为 可 以 设 a 和 5b 是 相同 的 元 素 ， 这 样 可 比 性 的 要 求 就 告诉 我 们 有 aRa。 


+ 示例 7.35 

整数 或 实数 上 的 算术 比较 三 和 三 都 是 全 序 关系 ， 因 此 也 都 是 偏 序 关系 。 请 注意 ， 对 任意 的 
a 和 b 来 说 ， 要 么 a 三 bp ,要么 b 三 a ,不 过 当 a=5b 时 刚好 两 者 都 成 立 。 

算术 比较 < 和 > 都 是 偏 序 关系 而 非 全 序 关系 。 尽 管 它们 是 反对 称 的 ， 不 过 不 是 自 反 的 ， 也 
就 是 说 a=a 和 wa>a 都 不 成 立 。 

对 应 某 个 全 集 U 的 2" 上 的 子 集 关系 5, 和 S, 都 是 偏 序 关系 。 我 们 已 经 知道 ， 它 们 是 传递 且 
反对 称 的 。 不 过 ， 只 要 U 中 至 少 有 两 个 成 员 ， 这 些 关系 就 不 是 全 序 关 系 ， 因 为 这 样 一 来 就 有 不 
可 比 的 元 素 了 。 例如, 设 U = 行 ,2}。 那 么 全 } 和 纪 } 都 是 0 的 子 集 ， 但 这 两 个 集合 之 间 谁 也 不 是 
谁 的 子 集 。 

大 家 可 将 全 序 关系 R 视 作 一 个 如 图 7-31 所 示 的 线性 元 素 序列 ， 其 中 只 要 对 不 同 的 元 素 a 和 4。 
有 aRb，a 就 出 现在 这 条 线 上 4b 的 左 侧 。 例 如 ， 如 果 R 是 整数 上 的 三 关系 ,那么 轴 上 的 元 素 就 
是 …, -2,-1,0,1,2,…。 如 果 R 是 实数 上 的 志 关系 ， 那么 这 些 点 就 对 应 实数 轴 上 的 点 ， 就 像 这 根 轴 
是 把 无 限 长 的 尺子 那样 ， 如 果实 数 x 非 负 ， 那 么 xz 就 是 在 0 标记 右 侧 x 个 单元 处 ， 而 如 果 xz 为 负 , 那 
么 它 就 在 0 标记 左 侧 -x 个 单元 处 。 

如 有 果 R 是 偏 序 关系 而 非 全 序 关 系 ， 还 可 以 将 定义 域 中 的 元 素 夯 成 这 样 : 如 果 aRD， 那 么 a 在 2 
的 左边 。 不 过 ， 因 为 可 能 存在 不 可 比 的 元 素 ， 所 以 不 一 定 能 做 到 把 所 有 元 素 画 在 一 条 轴 上 从 而 
使 关系 R 意 味 着 “在 左边 ”。 

EE 


Q1 Q2 U3 Qn 


图 7-31 表示 aj, ac, a3,…, 4a, 上 的 全 序 关系 的 图 
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+ 示例 7.36 

图 7-32 展 示 了 偏 序 关系 S,, 。 我 们 已 经 将 该 关系 绘 成 了 简化 图 (reduced graph )， 在 图 中 
省 略 了 可 由 传递 性 指出 的 弧 。 也 就 是 说 要 有 S So 7 ， 就 要 满足 以 下 任 一 条 件 。 

(1) S=7。 

(2) 存在 从 S 到 7 的 弧 。 

(3) 从 S 到 7 之 间 有 一 条 由 两 条 或 多 条 弧 构 成 的 路 径 。 
例如 ， 我 们 知道 名 5S, ,,, {1,3} ， 因 为 存在 路 径 从 名 到 {1} 再 到 {1,3}。 














图 7-32 ”表示 偏 序 关系 5, ,的 简化 图 


7.10.5 等 价 关 系 

等 价 关系 是 自 反 、 对 称 且 传递 的 二 元 关系 。 这 种 关系 与 之 前 的 示例 中 看 到 的 偏 序 关 系 和 全 
序 关系 差别 很 大 。 事 实 上 ， 偏 序 关 系 从 不 可 能 是 等 价 关 系 ， 除 非 在 声明 的 定义 域 为 空 ， 或 者 声 
明定 义 域 中 只 有 一 个 元 素 a 而 且 该 关系 是 {(a,a)} 这 样 一 些微 不 足 道 的 情况 下 。 








+ 示例 7.37 

像 整 数 上 的 三 这 样 的 关系 就 不 是 等 价 关 系 。 虽 然 它 是 传递 旦 自 反 的 ,但 它 不 是 对 称 的 。 如 
果 a 三 bp ， 除 非 a =b， 否 则 是 不 会 有 4b 三 a 的。 

举 个 等 价 关 系 的 例子 ， 设 R 是 由 那些 满足 a-b 是 3 的 整数 倍 的 整数 有 序 对 (a,5) 组 成 的 。 比 
如 ，3R9， 因 为 3-9=-6=3x(-2) 。 还 有 5R(-4) ， 因 为 5-(-4)=9=3x3。 不过， (1,2) 就 不 在 R 
中 ， 或 者 可 以 说 “1R2 不 成 立 ”， 因 为 1-2 = -1 ， 它 不 是 3 的 整数 倍 。 可 以 按照 如 下 方式 展示 有 R 是 
等 价 关系 。 

(1) R 是 自 反 的 ， 由 于 对 任意 副 数 a 都 有 aRa， 这 是 因为 a-a 为 0， 是 3 的 整数 倍 。 

(2) R 是 对 称 的 。 如 果 a -5b 是 3 的 整数 倍 ,比方 说 是 3c, 其 中 c 为 某 整数 , 那么 5 一 a 就 是 -3c ， 
因此 也 是 3 的 整数 倍 。 

(3) R 是 传递 的 。 假 设 aRb 而 且 bRc， 也 就 是 说 ，a -2 是 3 的 倍数 ， 比 方 说 是 34， 而 b-c 也 是 3 
的 倍数 ， 比 方 说 是 3e。 那 么 

a—c=(a—b)+(b—c)=3d+3e=3(d+e) 
因此 a-c 也 是 3 的 倍数 。 由 aRb 和 4bRc 得 出 aRc， 这 表示 RR 是 传递 的 。 
再 举 个 例子 ， 设 5S 是 世界 城市 的 集合 ， 而 7 是 由 a7b 定 义 的 关系 ， 其 中 a 和 b 是 由 公路 相连 的 ， 
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也 就 是 说 ， 可 以 从 a 驾车 到 达 b。 因 此 ， 有 序 对 (多伦多, 纽约 ) 是 在 7 中 , 不 过 (檀香山,， 安 克 
雷 奇 ) 就 不 在 7 中 。 可 以 说 7 是 等 价 关 系 。 

7 是 自 反 的 ， 因 为 每 个 城市 都 是 连接 到 它 自己 的 。7 也 是 对 称 的 ， 因 为 如 果 a 连 接 到 2， 那 么 
bp 也 连接 到 a。7 还 是 传递 的 ， 因 为 如 果 a 连 接 到 bp， 且 bp 连接 到 c， 那么 a 是 连接 到 c 的 ， 如 果 没 有 更 
短路 径 的 话 ， 可 以 通过 5b 从 a 行驶 到 c。 
7.10.6 ”等 价 类 

另 一 种 看 待 等 价 关 系 的 方式 是 , 它 将 子 集 的 定义 域 分 成 了 等 价 类 。 如 果 R 是 定义 域 D 上 的 等 
价 关 系 ， 那 么 可 以 将 D 分 为 等 价 类 ， 使 得 下 列 命 题 成 立 。 

(1) 每 个 定义 域 元 素 刚 好 在 一 个 等 价 类 中 。 

(2) 如 果 aRb5， 那 么 a 和 2b 在 相同 的 等 价 类 中 。 

(3) 如 果 aRb 不 成 立 ， 那 么 a 和 5b 在 不 同 的 等 价 类 中 。 


+ 示例 7.38 

考虑 示例 7.37 中 的 关系 R, 其 中 当 a -2 是 3 的 倍数 时 有 aRb。 一 个 等 价 类 是 刚好 被 3 整除 的 整 
数 的 集合 ， 也 就 是 除 以 3 余数 为 0 的 那些 整数 的 集合 。 该 类 为 {…, -3,0,3,6,…}。 第 二 个 是 除 以 3 
时 余数 为 1 的 整数 的 集合 ,也 就 是 {…, -2,1,4,7,…}。 最 后 一 个 类 是 除 以 3 时 余数 为 2 的 整数 的 集合 ， 
该 类 为 {…, 一 1,2,5,8,…}。 这 些 类 将 整数 集 划 分 成 3 个 不 相交 的 集合 ， 如 图 7-33 所 示 。 

请 注意 ， 当 两 个 整数 除 以 3 的 余数 相同 时 ， 它 们 的 差 就 能 被 3 整除 。 例 如 ，14 =3x4+2 而 
S$=3xl+2 ,因此 14-$=3x4-3xl+2-2=3x3， 于 是 可 知 14RS。 另 一 方面 ， 如 果 两 个 整数 除 
以 3 的 余数 不 同 ， 它 们 的 差 就 肯定 不 能 被 3 整除 。 因 此 ， 来 自 不 同等 价 类 的 整数 ( 比如 5 和 7 ) 之 
间 ， 就 不 具备 R 关 系 。 























刚好 能 被 3 整除 





图 7-33 ”整数 上 的 关系 “ 差 能 被 3 整除 ”相应 的 等 价 类 


要 为 等 价 关 系 R 构 建 等 价 类 ， 设 class(aq) 是 满足 aRb 的 元 素 5 的 集合 。 例 如 ， 如 果 等 价 关 系 是 
示例 7.37 中 我 们 称 为 R 的 那个 , 那么 class(4) 就 是 除 以 3 时 余数 为 1 的 整数 的 集合 , 也 就 是 说 class(4) 
= 全 21.4.7, 

请 注意 ， 如 果 让 a 对 定义 域 的 各 元 素 而 言 是 不 同 的 ， 通 常会 多 次 得 到 同样 的 类 。 其 实 ， 当 有 
aRb 时 ， 就 有 class(a) = class(p)。 要 知道 为 什么 ， 可 以 假设 c 在 class(q) 中 。 则 根据 类 的 定义 有 aRc。 
为 给 定 了 aRb， 根 据 对 称 性 有 bRa。 而 根据 传递 性 ， 由 bRa 和 aRc 可 以 得 出 bBRc。 而 bRc 就 说 明 c 
在 class(D) 中 。 因 此 ，class(a) 中 的 每 个 元 素 都 在 class(b) 中 。 因 为 同样 的 推理 告诉 我 们 ， 只 要 aRb， 
那么 class(Db) 中 的 每 个 元 素 也 都 在 class(q) 中 , 所 以 我 们 可 以 得 出 结论 : class(q) 和 class(D) 是 相同 的 。 

不 过 ， 如 果 class(aq) 和 class(5) 不 同 ， 则 这 些 类 不 可 能 有 相同 的 元 素 。 作 相反 的 假设 ,那么 就 
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肯定 有 某 个 c 同 时 在 class(q) 和 class(D) 中 。 而 根据 之 前 的 假设 ， 知 道 有 aRc 和 bRc。 根 据 对 称 性 ， 
有 cRb。 根 据 传 递 性 ， 可 由 aRc 和 cRb 得 到 aRb。 不 过 我 们 刚 证 明了 ， 只 要 aRb 成 立 ， 则 class(q) 和 
class(p) 是 相同 的 。 而 这 里 假设 这 些 类 是 不 同 的 , 因此 就 得 出 了 矛盾 。 所 以 ,假设 的 出 现在 class(a) 
和 ciass(D) 的 交集 中 的 元 素 c 不 可 能 存在 。 

还 要 看 到 : 每 个 定义 域 元 素 都 在 某 个 等 价 类 中 。 特 别 要 说 的 是 ，4 总 是 在 class(o) 中 ， 因 为 
自 反 性 告诉 我 们 有 waRa。 

我 们 现在 就 可 以 得 出 结论 ， 等 价 关 系 将 其 定义 域 划 分 为 不 相交 的 等 价 类 ， 而 且 将 每 个 元 素 
刚好 放 在 一 个 类 中 。 示 例 7.38 就 展示 了 这 一 现象 。 
7.10.7 关系 的 闭 包 

对 二 元 关系 的 常见 运算 还 有 一 种 ,就 是 取 某 个 不 具有 自 反 性 (或 对 称 性 、 传 递 性 ) 的 集合 ， 
在 为 其 添加 尽 可 能 少 的 有 序 对 后 使 得 新 形成 的 关系 具有 自 反 性 (或 对 称 性 、 传递 性 )。 得 到 的 关 
系 就 称 为 原 关系 的 目 反 (或 对 称 、 传 递 ) 财 包 。 


+ 示例 7.39 

我 们 在 图 7-32 中 讨论 过 简化 图 。 虽 然 表 示 的 是 传递 关系 S, ,,,， 但 是 只 画 出 了 与 该 关系 中 
有 序 对 的 某 个 子 集 对 应 的 弧 。 不 过 通过 应 用 传递 法 则 推断 出 新 的 有 序 对 ， 直 到 不 能 推 凯 出 新 的 
有 序 对 ， 就 可 以 重建 完整 的 关系 。 例 如 ， 我 们 看 到 存在 有 序 对 ({1},{1,3})) 和 ({1,3}, 行 ,2,3}) 相 对 
应 的 弧 , 因此 传递 法 则 就 告诉 我 们 有 序 对 ({1},{1,2,3)) 也 肯定 在 该 关系 中 。 而 该 有 序 对 与 有 序 对 
(名 , 生 )) 一 起 , 义 说 明 ( 儿 ,{1,2,3) 也 在 该 关系 中 。 除 此 之 外 , 还 必须 加 上 “ 自 反 的 ”有 序 对 (5,5)， 
其 中 S 是 {1,2,3} 的 各 个 子 集 。 这 样 一 来 ， 就 重建 了 关系 S( ,, 中 的 所 有 有 序 对 。 

男 一 种 实用 的 闭 包 运 算是 拓扑 排序 ， 我 们 接受 某 个 偏 序 ， 并 癌 其 添加 元 组 ， 直 到 它 成 为 全 
序 。 尽管 二 元 关系 的 传递 团 包 是 唯一 的 , 但 常常 有 多 个 全 序 包含 某 一 给 定 的 偏 序 。 我 们 将 在 第 9 
划 中 了 解 到 一 种 特别 高 效 的 拓扑 排序 算法 。 现 在 ， 先 考虑 一 个 展示 拓扑 排序 实用 性 的 例子 。 
+ 示例 7.40 

人 们 党 将 生产 过 程 中 必须 执行 的 一 系列 任务 表示 为 一 套 必须 服从 的 “优先 级 ”。 举 个 简单 的 
例子 , 在 给 左 脚 罕 鞋 之 前 必须 先 给 左 脚 穿 上 福子 , 而 在 穿 上 右 脚 的 鞋 之 前 要 先 罕 上 右 脚 的 袜子 。 
不 过 ， 这 其 中 没有 其 他 必须 遵守 的 优先 级 了 。 我 们 可 以 用 由 两 个 有 序 对 ( 左 袜 ， 左 鞋 ) 和 ( 右 袜 ， 
右 鞋 ) 组 成 的 集合 来 表示 这 些 优 先 级 。 该 集合 是 个 偏 序 。 

可 以 将 该 集合 扩展 为 6 个 不 同 的 全 序 。 其 中 一 个 全 序 是 先 穿 好 左 脚 的 鞋 袜 , 该 关系 是 含 以 下 
10 个 有 序 对 的 集合 。 

( 左 慰 ， 左 袜 )  ( 左 栖 ,， 左 鞋 ) ” ( 左 袜 ,， 右 钵 )  ( 左 袜 ， 右 鞋 ) 
( 左 鞋 ， 左 鞋 )  ( 左 鞋 ， 右 袜 ) “( 左 鞋 ， 右 鞋 ) 

( 右 袜 ， 右 宾 ) “( 右 袜 ， 右 鞋 ) 

( 右 鞋 ， 右 土 ) 


可 将 该 全 序 视 作 如 下 线性 排列 


















































左 袜 一 左 鞋 一 右 袜 一 右 畦 
先 穿 好 右 脚 的 鞋 袜 有 着 与 之 相似 的 过 程 。 
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由 原始 的 偏 序 还 可 以 得 到 其 他 4 种 全 序 , 其 中 我 们 要 先 穿 袜子 再 穿 鞋 , 它们 可 由 以 下 线性 排 
列表 示 : 





左 袜 一 右 袜 一 左 鞋 一 右 鞋 
左 福 一 右 袜 一 石 鞋 一 左 鞋 
右 袜 一 左 袜 一 左 鞋 一 石 鞋 
右 福 一 左 袜 一 右 鞋 一 左 鞋 
闭 包 的 第 三 种 形式 是 找到 含有 某 给 定 关系 的 最 小 等 价 关 系 。 例 如 ， 公 路 图 表示 的 关系 是 由 
公路 路 段 直 接连 接 而 不 含 中 间 城 市 的 城市 对 组 成 的 。 要 确定 由 公路 连接 的 城市 ， 可 以 利用 自 反 
性 、 传 递 性 和 对 称 性 推断 出 由 某 些 基础 道路 序列 连接 的 城市 对 。 闭 包 的 这 种 形式 称 为 找 出 图 中 
的 “连通 分 支 ”( connected component )， 我 们 将 在 第 9 章 讨 论 一 种 解决 该 问题 的 高 效 算法 。 


7.10.8 习题 


(1) 给 出 对 某 一 声明 定义 域 自 反 ， 但 对 另 一 声明 定义 域 不 自 反 的 关系 。 请 记 住 ， 对 作为 某 关 系 R 可 能 
的 定义 域 的 D 而 言 ，D 必 须 包含 出 现在 R 的 有 序 对 中 的 每 个 元 素 ， 但 它 还 可 以 包含 更 多 的 元 素 。 

(2) ## 关 系 ss 中 有 多 少 个 有 序 对 ? 考虑 一 般 的 情况 ， 如 果 V 有 xz 个 元 素 ,， 那么 s 中 有 多 少 个 有 序 
对 ? 提示 : 试 着 从 元 素 较 少 的 情况 猜测 该 函数 ， 比 如 含 两 个 元 素 的 情况 下 有 9 个 有 序 对 ， 如 图 7-27 
所 示 。 然 后 通过 归纳 证 明 自 己 的 猜测 是 正确 的 。 

(3) 考虑 定义 域 在 4 字母 字符 串 上 的 二 元 关系 R， 它 是 由 sR1 定 义 的 ， 其 中 1 是 由 字符 串 s 的 字母 向 左 循 
环 移动 一 位 形成 的 。 也 就 是 说 ，abcdRbcda， 其 中 a、b5、c、d 都 是 单独 的 字母 。 确 定 R 是 否 为 (a) 
自 反 的 ; (b) 对 称 的 ; (c) 传 递 的 ; (d) 偏 序 ， 和 (或 ) (e) 等 价 关 系 。 为 每 种 情况 给 出 简要 论证 或 
是 反例 。 

(4) 考虑 习题 (3) 中 的 4 字母 字符 串 定义 域 。 设 S 是 应 用 0 次 或 多 次 R 组 成 的 二 元 关系 。 因 此 ，abcdSabcd， 
abcdSbcda，abcdScdab， 且 abcdSdabc。 换 人 句 话 说 ， 字符 串 与 它 经 过 任意 循环 位 移 后 形成 的 字符 串 
具有 45 关系 。 对 关系 8 回答 习题 (3) 中 提出 的 5 个 问题 ， 并 且 每 种 情况 都 要 给 出 论证 。 

(3)* 以 下 “证 明 ” 有 何 错误 ? 

( 非 ) 定理 : 如 果 二 元 关系 R 是 对 称 且 传递 的 ， 那 么 R 是 自 反 的 。 
( 非 ) 证 明 : 设 x 是 R 定 义 域 中 的 某 个 成 员 ， 取 某 个 满足 xRy 的 y。 根 据 对 称 性 ， 有 yRx。 而 根据 传递 
性 ，xRy 和 yRx 可 以 得 出 xRx。 因 为 x 是 R 定 义 域 的 任 一 成 员 ， 所 以 证 明了 xRx 对 R 定 义 域 中 的 每 个 元 
素 都 成 立 ， 也 就 “证 明 ” 了 R 是 自 反 的 。 
(6) 给 出 声明 定义 域 为 {1,2,3}， 具 有 如 下 属性 的 二 元 关系 的 例子 。 
(a) 自 反 上 且 传 递 ， 但 不 对 称 。 
(b) 自 反 且 对 称 ， 但 不 传递 。 
(c) 对 称 且 传递 ， 但 不 自 反 。 
(d) 对 称 且 反对 称 。 
(e) 自 反 , 传递， 而且 是 全 函数 。 
(f) 反对 称 ， 而 且 是 一 一 对 应 。 

(7) * 如 果 为 关系 ,使 用 简化 图 ， 其 中 集合 UV 有 nn 个 元 素 ， 那 么 与 使 用 完全 图 相 比 要 节省 多 少 条 弧 ? 

(8) 当 U 只 有 一 个 元 素 时 ，(a) S, 和 (b) cv 是 否 为 偏 序 或 全 序 ?” 当 U 中 没有 元 素 时 呢 ? 

(9)* 从 n=1 开始， 通过 对 n 的 归纳 证 明 ， 如 果 有 n 个 有 序 对 aoRa1、alRa;、…、an_iRan， 而 且 如 果 R 是 
传递 的 关系 , 那么 有 aoRa,。 也 就 是 要 证 明 ， 如 果 表 示 传 递 关 系 的 图 中 存在 任 一 路 径 ， 就 存在 一 条 
从 该 路 径 开头 到 该 路 径 结 尾 的 弧 。 

(10) 找 出 包含 有 序 对 (a,5) 、(a,c) 、(4d,e) 和 (2b, 了) 的 最 小 等 价 关系 。 

(11) 设 R 是 整数 集 上 满足 如 下 条 件 的 关系 ， 蔡 a 和 b 是 互 不 相同 的 而 且 有 除了 1 之 外 的 公约 数 ， 则 aRb。 
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确定 R 是 否 为 (a@) 自 反 的 ; (b) 对 称 的 ;(c) 传 递 的 ;，(d) 偏 序 和 (或) (e) 等 价 关系 。 

(12) 存在 某 树 T7 所 有 节点 上 的 关系 Rj. ,其 中 当 且 仅 当 在 树 7 中 a 是 5 的 祖先 时 有 aRjb ,针对 该 关系 重复 
习题 (11) 中 的 练习 。 

(13) 存在 茶树 7 所 有 节点 上 的 关系 5S; ， 其 中 当 且 仅 当 在 树 T 中 a 在 b 的 左 侧 时 有 ay; ， 针 对 该 关系 重复 
习题 (12) 中 的 练习 。 


7.11 无 限 集 


人 们 在 计算 机 程序 中 要 实现 的 所 有 集合 都 是 有 限 的 ， 如 果 这 些 集 合 不 是 有 限 的 ， 就 没 法 将 
它们 存储 在 计算 机 的 内 存 中 。 而 在 数学 中 ， 很 多 集合 ( 比如 整数 集 或 实数 集 ) 都 是 无 限 的 。 这 
些 观点 似乎 直观 清晰 ， 不 过 有 限 集 和 无 限 集 到 底 有 何 区 别 呢 ? 

有 限 集 和 无 限 集 之 间 的 区 别 是 相当 令 人 惊讶 的 。 有 限 集 的 元 素数 量 与 它 任 一 真子 集 的 元 素 
数量 都 不 同 。 回 想 一 下 ， 在 7.7 节 中 ， 我们 说 过 可 以 利用 两 个 集合 间 一 一 对 应 的 存在 得 出 它们 是 
等 势 的 (equipotent )， 也 就 是 说 ， 它 们 有 着 相同 数量 的 成 员 。 

如 果 取 一 个 如 S = {1,2,3,4} 这 样 的 有 限 集 及 其 任意 真子 集 ， 如 7 = 112,3}， 那 么 在 这 两 个 集 
合 间 没 办 法 找到 一 一 对 应 。 例 如 ， 可 以 把 S 中 的 4 映射 到 7 中 的 3， 把 S 中 的 3 映射 到 7 中 的 2， 把 5 
中 的 2 映射 到 7 中 的 1， 但 接着 就 找 不 出 7 中 的 成 员 来 和 5 中 的 1 相关 联 。 其 他 建立 从 S 到 7 的 一 一 对 
应 的 尝试 也 一 定 同 样 失败 。 

大 家 直观 上 可 能 会 认为 这 一 点 对 任意 集合 来 说 都 应 该 成 立 ， 一 个 集合 在 丢掉 其 中 一 个 或 多 
个 元 素 后 怎么 可 能 还 具有 相同 的 元 素数 呢 ? 考虑 一 下 自然 数 ( 非 负 整数 ) 集 N 和 N 去 掉 0 后 得 到 
的 真子 集 ， 称 该 集合 为 N- {0}，{12,3,…}。 那 么 考虑 一 下 从 N 到 Ar- {0} 的 一 一 对 应 玉 ， 其 中 
F(0) = 1，F(1)=2, 一 般 来 讲 ，FGQi) = 二 1。 

惊人 的 是 ，Ff 是 从 N 到 N- {0} 的 一 一 对 应 。 对 N 中 的 每 个 ?， 至 多 有 一 个 /满足 FnD) =7j， 所 以 Ff 是 
个 函数 。 其 实 ， 刚 好 就 有 一 个 这 样 的 ;， 即 i 计 1， 使 得 一 一 对 应 的 定义 中 的 条 件 (1) ( 见 7.7 节 ) 得 到 
满足 。 对 N- {0} 中 的 每 个 ， 存 在 某 个 广 足 FG)=j， 也 就 是 ，i= 订 1。 因 此 一 一 对 应 的 定义 中 的 条 
件 (2) 也 得 到 满足 。 最 后 ， 在 N 中 不 存在 两 个 不 同 的 数字 i 和 使 得 FQ) 和 F(i,) 都 为 ?j， 因 为 那样 的 话 
ii+1 和 +1 都 为 i, 这 样 一 来 就 得 出 i = 进而 就 得 出 F 是 N 与 其 真子 集 N- {0} 之 间 一 一 对 应 的 结论 。 






































无 限 酒店 


为 了 帮助 大 家 理解 从 0 开始 和 从 1 开始 有 着 同样 多 的 数字 ,可 以 想象 一 家 酒店 , 它 有 着 无 限 
个 房间 ， 分 别 编 号 为 0、1、2， 等 等 。 对 任意 整数 而 言 ， 都 存在 一 个 以 该 整数 作为 房 号 的 房间 。 
在 某 一 特定 时 间 ， 每 个 房间 里 都 会 有 一 名 顾客 。 一 只 袋鼠 来 到 前 台 开 房间 。 前 台 接 待 告诉 它 : 
“我 们 这 里 不 接待 袋 据 。” 等 一 下 ,这 跑题 了 。 事实 上 ， 前台 接待 按照 如 下 方式 给 袋鼠 腾 出 了 房 
间 。 他 让 0 号 房间 的 客人 住 进 1 号 房 ， 让 1 号 房 的 客人 住 进 2 号 房 ， 等 等 。 所 有 的 旧 客 都 还 是 有 一 
间 房 可 住 ， 而 现在 0 号 房 是 空房 了 ， 而 这 只 袋鼠 就 住 进 了 0 号 房 。 这 种 “戏法 ”之 所 以 能 奏效 ， 
是 因为 从 1 开始 编号 的 房间 与 从 0 开始 编号 的 房间 其 实 是 同样 多 的 房间 。 





7.11.1 无 限 集 的 正式 定义 
数学 家 们 认可 的 定义 是 ,无限 集 是 指 自 身 与 其 至 少 一 个 真子 集 之 间 存 在 一 一 对 应 的 集合 。 
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在 一 些 极端 例子 下 ， 无 限 集 和 其 某 个 真子 集 之 间 可 以 存在 一 一 对 应 关系 。 


+ 示例 7.41 

自然 数 集合 与 偶 自 然 数 集合 是 等 势 的 。 设 FoD) = 2i。 那么 就 是 一 一 对 应 , 它 将 0 映射 到 0，1 
映射 到 2，2 映 射 到 4，3 映 射 到 6， 而 一 般 来 讲 ， 就 是 将 每 个 自然 数 映 射 到 一 个 唯一 的 自然 数 ， 它 
的 两 倍 。 

同样 ，Z 和 N 是 同样 大 小 的 集合 ,也 就 是 说 ， 非 负 整 数 和 负 整 数 一 起 ,与 非 负 整数 是 一 样 多 
的 。 设 对 所 有 的 ;过 0， 有 FUD = 2i， 并 设 对 所 有 的 i<0 ， 有 F(i) = 一 2i-1。 那 么 0 映射 到 0，1 映 射 
到 2， -1 映射 到 1，2 映 射 到 4，-2 映 射 到 3， 等 等 。 每 个 整数 都 被 映射 到 一 个 唯一 的 非 负 整数 ,其 
中 负 整 数 映射 为 奇数 ， 而 非 负 整数 则 映射 为 偶数 。 

更 让 人 咋舌 的 是 ， 自 然 数 对 组 成 的 集合 与 N 本 身 也 是 等 势 的 。 要 知道 这 样 的 一 一 对 应 是 如 
何 构建 起 来 的 ， 可 以 考虑 一 下 图 7-34， 其 中 展示 了 N x N 中 的 有 序 对 分 布 在 一 个 无 限 的 方 阵 中 。 
我 们 根据 有 序 对 中 组 分 的 和 来 确定 它们 的 次 序 ， 而 对 那些 组 分 的 和 相等 的 有 序 对 ， 则 根据 其 第 
一 个 组 分 的 大 小 确定 次 序 。 这 一 次 序 始 于 (0,0)、(0,1)、(1,0)、(0,2)、(1,1)、(2,0)、(0,3)、(1,2)， 
等 等 ， 如 图 7-34 所 示 。 











5 | 15 
1 4|10 16 
73|6 11 
人 | 总 了 池 
1|1 4 8 13 
0|0 2 5 9 14 
0 1 2 3 45 
2 一 人 


图 7-34 ”为 自然 数 对 排序 


现在 , 这 些 自然 数 对 有 了 先后 次 序 。 原 因 在 于 ,对 任意 自然 数 对 (i,j)， 和 比 其 小 的 自然 数 对 
的 数量 是 有 限 的 ， 而 和 相同 情况 下 值 更 小 的 自然 数 对 的 数量 也 是 有 限 的 。 其 实 ， 我们 可 以 计算 
自然 数 对 (i 让 在 这 一 次 序 中 的 位 置 ， 就 是 (i+7) (itj+1)/2+i。 也 就 是 说 ， 我 们 的 一 一 对 应 是 将 自然 
数 对 (i 与 唯一 的 自然 数 (i+t) (iti+1)/2+i 关 联 起 来 。 

请 注意 ,一 定 要 谨慎 选择 为 有 序 对 排序 的 方式 。 假 设 在 图 7-34 中 按 行 排 序 ， 那 么 永远 都 没 
法 到 达 第 二 行 或 更 高 行 的 自然 数 对 ， 因 为 每 一 行 中 都 有 无 数 个 自然 数 对 。 同 样 ， 按 列 排 序 也 是 
行 不 通 的 。 


























集合 不 是 有 限 的 ， 就 是 无 限 的 


车 一 看 ， 可 能 会 出 现 不 那么 有 限 和 不 那么 无 限 的 事物 。 例 如 ， 当 谈论 链表 时 ， 对 链表 的 长 
度 未 作 限 制 。 而 只 要 在 程序 的 执行 中 创建 了 链表 ， 它 就 具有 了 有 限 的 长 度 。 因 此 ， 可 以 作出 如 
下 区 分 。 

(1) 每 个 链表 的 长 度 都 是 有 限 的 ， 也 就 是 说 ， 它 的 单元 数 是 有 限 的 。 

(2) 链表 的 长 度 可 能 是 任何 非 负 整 数 ， 而 链表 可 能 长 度 的 集合 是 无 限 的 。 
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无 限 集 的 正式 定义 是 很 有 意思 的 ， 不 过 这 一 定义 可 能 不 符合 我 们 对 无 限 集 的 直觉 认识 。 例 
如 ， 我 们 可 能 觉得 无 限 集 是 对 每 个 整数 而 言 ， 包 含 至 少 n 个 元 素 的 集合 。 好 在 可 以 证 明 这 一 属 
性 是 每 个 由 正式 定义 可 知 无 限 的 集合 都 具备 的 ， 这 一 证 明 过 程 又 要 用 到 归纳 法 。 

命题 Stn) 。 如 果 I 是 有 限 集 ， 那 么 具有 一 个 含 n 个 元 素 的 子 集 。 

依据 。 设 n=0， 显然 有 名 S51。 

归纳 。 假 设 对 某 个 nn 三 0 有 Sln)。 要 证 明 [ 有 有 一 个 食 n+1 个 元 素 的 子 集 。 根 据 归纳 假设 ,， 
有 一 个 含 n 个 元 素 的 子 集 T, 根据 无 限 集 的 正式 定义 , 存在 某 个 真子 集 J CI, 以 及 从 1 到 .的 一 一 
对 应 f。 设 a 是 -J 中 的 元 素 ， 因 为 /是 个 真子 集 ， 所 以 a 肯定 是 存在 的 。 

考虑 R，7 在 在 的 镜像 ， 也 就 是 说 ， 若 了 = {2 …,b,} ， 则 R={f(B5)…, 了 f(b,)}。 因 为 但 一 一 
对 应 ， 则 Fo)…, 7) 各 不 相同 , 所 以 R 的 大 小 也 为 nm。 因为 是 从 /到 ,的 , 所 以 每 个 f(b,) 都 在 J 
中 ,也 就 是 说 RS 。 因 此，a 不 可 能 在 R 中 。 这 样 一 来 ，RU {a} 就 是 7 舍 2+1 个 元 素 的 子 集 ， 这 
证 明了 So+D 。 




















集合 的 基数 


如 果 存 在 从 $ 到 7 的 一 一 对 应 ， 就 定义 两 个 集合 S 和 7 是 等 势 的 (大 小 相等 )。 等 势 是 在 任意 
由 集合 组 成 的 集合 上 的 等 价 关 系 ， 我 们 将 这 一 点 留 作 本 节 习 题 。 集 合 S 所 属 的 等 价 类 就 称 作 S 
的 基数 。 例 如 ， 空 集 属于 它 自身 的 等 价 类 ， 可 以 用 基数 0 来 标识 该 类 。 含 有 集合 {a} ( 其 中 4 为 
任意 元 素 ) 的 类 是 基数 1， 而 含 集 合 {4,b} 的 类 是 基数 2， 等 等 。 

含 N 的 类 是 “整数 的 基数 ”， 通 常 称 为 阿 列 夫 零 (aleph-0 )， 而 该 类 中 的 集合 都 是 可 数 集 。 
实数 的 集合 属于 另 一 个 通常 被 称 为 连续 统 的 等 价 类 。 其 实 ， 不 同 的 无 限 基数 有 无 数 个 。 





7.11.2 ”可 数 集 与 不 可 数 集 


由 示例 7.41, 我 们 可 能 会 认为 所 有 无 限 集 都 是 等 势 的 。 我 们 已 经 看 到 整数 的 集合 Z 以 及 非 负 
整数 的 集合 N 是 同样 大 小 的 , 还 有 一 些 直觉 上 讲 “ 似 乎 ” 比 N 小 的 集合 也 与 它 大 小 相同 。 因 为 我 
们 在 示例 7.41 中 看 到 ， 自 然 数 对 是 与 N 等 势 的 ， 而 非 负 有 理 数 也 是 与 自然 数 等 势 的 ， 因 为 有 理 数 
是 由 其 分 子 和 分 母 组 成 的 自然 数 对 。 同 样 ， 可 以 证 明 ( 非 负 和 负 ) 有 理 数 与 整数 是 等 势 的 ， 
此 也 就 与 自然 数 是 等 势 的 。 

对 任意 集合 S 而 言 ， 如果 存 在 从 $ 到 N 的 一 一 对 应 ， 就 说 该 集合 是 可 数 的 。 这 里 用 到 术语 “可 
数 的 ”是 说 得 通 的 , 因为 肯定 有 一 个 与 0 对 应 的 元 素 , 一 个 与 1 对 应 的 元 素 , 等 等 , 所 以 可 以 “ 数 ” 
5 的 成 员 。 我们 之 前 说 过 的 ， 整 数 、 有 理 数 、 侦 数 ， 以 及 自然 数 对 的 集合 ， 都 是 可 数 集 。 还 有 很 
多 其 他 的 可 数 集 ， 我 们 在 这 里 把 对 合适 的 一 一 对 应 的 探索 留 作 练 习 。 

不 过 ,也 存在 不 可 数 的 无 限 集 。 特 别 要 指出 的 是 ,实数 就 是 不 可 数 的 。 其 实 ， 可 以 证 明 从 0 
到 1 之 间 的 实数 要 比 自然 数 多 。 论 证 的 关键 在 于 ,0 到 1 之 间 的 实数 都 可 以 表示 为 无 限 长 度 的 小 数 。 
我 们 为 小 数 点 右 侧 的 位 标记 上 0、1 等 编号 ， 如 果 从 0 到 1 之 间 的 实数 是 可 数 的 ， 那 么 可 以 将 它们 
标记 为 m、 方 ， 等 等 ， 然 后 就 可 以 将 这 些 实数 排列 在 一 个 无 限 的 方 阵 表格 中 ， 如 图 7-3$ 所 示 。 在 
假设 的 从 0 到 1 的 所 有 实数 的 排列 中 ，zx/10 被 分 配 到 第 0 行 ，5/9 被 分 配 到 第 1 行 ，5/8 被 分 配 到 第 
2 行 ，4/33 被 分 配 到 第 3 行 ， 等 等 。 

不 过 ， 可 以 证 明 图 7-35 并 不 能 真正 表示 0 到 1 这 个 范围 内 所 有 实数 的 列表 。 我 们 的 证 明 是 被 
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称 为 对 角 化 的 一 类 过 程 ， 要 使 用 表 的 对 角 线 创造 出 一 个 不 可 能 在 该 实数 列表 中 的 值 。 假 设 创造 
一 个 新 实数 r-， 其 十 进 制 表示 为 0.4o4a142。 第 位 的 值 a;， 取 决 于 对 角 线 上 的 第 i 个 数字 ， 也 就 是 在 
第 i 个 实数 的 第 位 找到 的 值 。 如 果 该 值 是 0 到 4， 就 设 a, = 8 。 如 果 对 角 线 上 第 个 位 置 是 5 到 9， 那 


人 三 ls 


位 置 
0 1 2 3 4 5 6 
0 | 3141 5 9 2 
1 5 5 5 5 5 5 5 
实数 2 | 62500000 
| 3 |1212121 
4 


图 7-35 ”假设 实数 是 可 数 的 ， 表示 实 数 的 假想 表格 


+ 示例 7.42 

给 定 如 图 7-35 所 示 的 部 分 表格 ,我 们 的 实数 x 是 从 0.8118… 开 始 的 。 要 知道 原因 ,， 请 注意 ，0 
号 实数 0 号 位 置 的 值 是 3， 所 以 a, =8 。1 号 实数 1 号 位 置 的 值 是 5， 所 以 a =1。 接 下 来 ， 2 号 实数 
2 号 位 置 的 值 是 5 而 3 号 实数 3 号 位 置 的 值 是 2， 所 以 接 下 来 的 两 位 数字 是 18。 

我 们 的 主张 是 , 即便 假设 所 有 从 0 到 1 的 实数 都 在 该 表 中 , r 也 不 会 出 现在 这 一 假想 的 实数 列 
表 中 。 假 设 " 是 ”， 与 第 ) 行 关联 的 实数 。 考 虑 x 与 ,的 差 4。r 的 十 进 制 展开 第 j 位 数字 为 a, ,我 们 
知道 该 值 是 具体 选择 的 , 从 而 与 x 第 /个 位 置 的 数字 存在 至 少 为 4 至 多 为 8 的 差 。 因此, 第 /个 位 置 
对 gq 的 贡献 在 4/10 站 到 9/10 站 之 间 。 

第 ;位 之 后 的 所 有 位 置 对 4 的 贡献 加 起 来 不 会 超过 1/10”， 因 为 这 就 是 r- 和 x 那些 位 置 上 一 个 
全 为 0 而 男 一 个 全 为 9 时 的 差 。 因 此 ，j 及 之 后 的 各 个 位 置 对 4 的 贡献 在 3/10 站 到 9/10 站 之 间 。 

最 后 ， 在 第 j 位 之 前 的 位 置 中 ,，r 和 要么 是 相同 的 ， 在 这 种 情况 下 ， 前 一 1 位 对 4 的 贡献 为 
0; 要 么 就 是 r 和 7 之 间 至 少 存在 10 的 区 别 。 不管 哪 种 情况 ,我 们 都 可 以 看 到 gd 不 会 为 0。 因 此 ， 
r 和 不 可 能 是 同一 个 实数 。 

这 样 就 可 以 得 出 x 不 在 该 实数 列表 中 的 结论 。 因 此 ， 我 们 假设 的 这 种 从 非 负 实数 到 从 0 到 1 
之 间 实 数 的 一 一 对 应 其 实 不 是 一 对 一 的 。 这 样 就 证 明了 ， 在 0 到 1 的 范围 内 至 少 存在 一 个 实数 x 
不 与 任何 整数 相关 联 。 


7.11.3 习题 


























在 从 7 到 有 R 的 一 一 对 应 g， 就 存在 从 $ 到 有 R 的 一 一 对 应 。 该 函数 是 /和 sg 的 复合 函数 ， 也 就 是 将 $ 中 的 x 
变 为 R 中 的 g(f(x)) 的 函数 。 
(2) 在 图 7-34 所 示 的 有 序 对 次 序 中 ， 编 号 为 100 的 有 序 对 是 哪个 ? 
(3)* 证 明 以 下 集合 是 可 数 的 (在 它们 和 自然 数 之 间 存 在 一 一 对 应 ) 。 
(a) 完全 平方 数 的 集合 。 
(b) 自然 数 三 元 组 (i,j, 有 D 的 集合 。 
(c) 2 的 乘 方 的 集合 。 
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(d) 自然 数 有 限 集 组 成 的 集合 。 

(4) ** 证明 自然 数 的 需 集 P(N) 与 实数 有 着 相同 的 基数 ， 也 就 是 说 ， 存 在 从 P(N) 到 0 至 1 这 一 范围 的 实数 
的 一 一 对 应 。 请 注意 ,这 一 结论 与 习题 (3) 的 (d) 小 题 并 不 矛盾 ， 因 为 现在 讨论 的 是 整数 的 有 限 集 和 
无 限 集 ， 而 我 们 只 能 为 有 限 集 计数 。 提 示 : 以 下 构造 几乎 能 行 得 通 了 ， 不 过 还 需要 进行 修正 。 考 
虑 一 下 任意 自然 数 集合 的 特征 向 量 。 该 向 量 是 有 限 的 0 和 1 组 成 的 序列 。 例 如 ，{0，1} 的 特征 向 量 
是 1100…， 而 含 奇数 个 自然 数 的 集合 的 特征 向 量 则 是 010101…。 如 果 在 特征 向 量 前 加 上 小 数 点 ， 
就 得 到 了 0 到 1 之 间 的 二 进 制 小 数 ， 它 是 表示 实数 的 。 因 此 ， 每 个 集合 都 可 以 转换 为 0 到 1 范围 内 的 
实数 ， 而 且 通 过 将 二 进 制 表 示 转 换 成 特征 向 量 ， 该 范围 内 的 每 个 实数 都 可 以 与 一 个 集合 相关 联 。 
这 种 关联 不 是 对 应 的 原因 在 于 ， 某 些 实数 可 能 会 有 两 种 二 进 制 表示 。 例 如 ，0.11000… 和 
0.10111… 都 表示 实数 3/4。 不过, 这 两 个 二 进 制 小 数 对 应 的 特征 向 量 表示 的 是 不 同 的 集合 , 前 者 表 
示 {0，1}， 而 后 者 则 表示 除了 1 之 外 的 所 有 整数 组 成 的 集合 。 大 家 可 以 修改 这 种 构造 以 定义 一 一 
对 应 。 

(5) ** 证 明 : 从 0 到 1 范围 内 的 实数 组 成 的 有 序 对 到 该 范围 的 实数 间 存 在 一 一 对 应 。 提 示 : 要 模仿 图 
7-34 中 的 表格 是 不 可 能 的 。 不 过 ， 我 们 可 以 取 某 个 实数 对 ， 比 方 说 是 (r+，s)， 然 后 将 表示 rr 和 s 的 
无 限 小 数 集合 起 来 ， 形 成 唯一 的 新 实数 1。t 与 r- 和 s 之 间 不 是 以 简单 的 算术 表达 式 相 关联 的 ,不 过 
从 t， 可 以 唯一 地 恢复 恢复 r 和 s。 大 家 必须 找 出 一 种 方式 ， 从 r 和 s 的 十 进 制 展开 构建 的 十 进 制 
展开 。 

(6) ** 证 明 : 只 要 集合 S 包 含 所 有 整数 大 小 0，1，… 的 子 集 ， 该 集合 就 是 符合 “无 限 集 ” 正 式 定 义 的 
无 限 集 ， 也 就 是 说 ，5 与 它 的 一 个 真子 集 间 存 在 一 一 对 应 。 
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大 家 应 该 从 本 草 中 了 解 到 了 以 下 要 点 。 

D 集合 的 概念 对 数学 与 计算 机 科学 来 说 都 是 基础 。 

口 集合 的 常见 运算 包括 可 以 用 文 氏 图 直观 呈现 的 并 集 、 交 集 和 差 集运 算 。 

口 代数 法 则 可 用 于 人 处理 和 简化 涉及 集合 与 集合 运算 的 表达 式 。 

D 链表 、 特征 向 量 和 散 列 表 提 供 了 3 种 表示 集合 的 基本 方式 。 链表 提供 了 适用 于 最 多 集合 运 
算 的 最 佳 灵 活性 , 但 并 非 总 是 最 高 效 的 。 特征 向 量 对 某 些 集合 运算 而 言 有 着 最 快 的 速度 ， 
但 只 能 用 于 全 集 规 模 较 小 的 情况 。 散 列表 是 通 稼 被 选用 的 方式 ， 兼 具 表示 的 经 济 性 与 访 
问 的 迅速 性 。 

口 (二 元 ) 关系 是 有 序 对 的 集合 。 函 数 是 对 某 给 定 的 第 一 个 组 分 而 言 至 多 有 一 个 元 组 的 

口 两 个 集合 间 的 一 一 对 应 关系 是 个 函数 ， 它 会 给 第 一 个 集合 中 的 各 个 元 素 关 联 上 第 二 个 集 
合 中 的 唯一 元 素 ， 反 之 亦 然 。 

口 二 元 关系 具有 一 些 重要 属性 ， 其 中 自 反 性 、 传 递 性 、 对 称 性 和 反对 称 性 属于 最 重要 的 。 

D 偏 序 、 全 序 和 等 价 关 系 是 二 元 关系 的 重要 特例 。 

口 无 限 集 是 指 那些 与 其 某 一 真子 集 间 存在 一 一 对 应 关系 的 集合 。 

D 一 些 无 限 集 是 “可 数 的 ”也 就 是 说 ,它们 与 整数 间 存 在 一 一 对 应 的 关系 。 男 外 一 些 无 限 
集 ， 比 如 实数 ， 是 不 可 数 的 。 

口 在 本 章 中 定义 的 集合 和 关系 上 的 数据 结构 与 运算 还 会 在 本 书 剩 下 的 部 分 以 多 种 不 同 的 方 
式 使 用 。 
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天 系数 据 模型 








计算 机 最 为 重要 的 一 项 应 用 就 是 存储 和 管理 信息 。 信 息 的 组 织 方 式 对 访问 和 管理 信息 的 容 
易 程 度 有 着 深刻 的 影响 。 也 许 最 简单 而 最 万 能 的 信息 组 织 方式 就 是 将 其 存储 在 表 中 。 

关系 模型 就 是 这 一 概念 的 核心 : 数据 被 组 织 成 称 为 “关系 ”的 二 维 表 和 集合。 我 们 还 可 以 将 
关系 模型 视 作 第 7 革 讨 论 的 集合 数据 模型 的 一 般 化 ， 是 将 二 元 关系 扩展 到 任意 元 的 关系 。 

之 所 以 最 初 要 研发 关系 数据 模型 ， 是 因为 要 用 于 数据 库 ， 即 长 时 间 存 储 在 计算 机 系统 中 的 
言 息 ， 并 用 于 数据 库 管 理 系 统 ， 即 让 人 们 可 以 存储 、 访 问 和 修改 这 些 信 息 的 软件 。 数 据 库 仍然 
是 我 们 理解 关系 数据 模型 的 重要 动机 。 现 在 它们 不 仅 存 在 于 最 初 的 那些 大 规模 应 用 中 ， 比 如 航 
空 订 票 系统 或 银行 系统 ,而 且 可 以 应 用 于 桌面 计算 机 ,处理 一 些 个 人 活动 , 诸如 维持 支出 记录 、 
作业 成 绩 ， 此 外 还 有 其 他 很 多 用 途 。 

除了 数据 库 系统 ， 其 他 类 型 的 软件 也 可 以 很 好 地 利用 信息 表 ， 而 关系 数据 模型 有 助 于 我 们 
设计 这 些 表 ， 并 人 研究 出 高 效 访问 这 些 信 息 表 所 和 需 的 数据 结构 。 例 如 ,这样 的 表 可 被 编译 带 用 来 
存储 与 程序 中 变量 有 关 的 信息 ， 记 录 它 们 的 数据 类 型 以 及 定义 它们 的 函数 。 


8.1 本草 主 要 内 容 


本 章 有 3 个 相互 交织 的 主题 , 首先 要 向 大 家 介绍 的 是 使 用 关系 模型 的 信息 结构 的 设计 , 我 们 
会 看 到 如 下 内 容 。 

口 信息 表 ， 称 作 “ 关 系 ”， 是 强大 而 灵活 的 信息 表示 方式 ( 8.2 节 )。 

口 设计 过 程 中 的 重要 环节 是 在 不 引入 “ 宛 余 ”, 即 某 一 事实 重复 若干 次 的 情况 下 , 选择 可 一 
起 存储 在 表 中 的 “属性 ”或 所 描述 对 象 的 属性 〈8.2 节 )。 

口 表 中 的 列 是 用 属性 命名 的 。 表 (或 关系 ) 的 “ 键 ” 是 其 值 能 唯一 确定 表 中 整 行 值 的 属性 
构成 的 集合 。 知 道 表 的 键 有 助 于 设计 表示 表 的 数据 结构 (8.3 节 )。 

口 索引 是 有 助 于 我 们 迅速 检索 或 更 改 表 中 信息 的 数据 结构 。 如 果 想 高 效 地 操作 表 ， 明 智 地 
选择 索引 是 至 关 重 要 的 〈8.4 节 、8.5$ 节 和 8.6 节 )。 

第 二 个 主题 是 数据 结构 加 速 数据 访 问 的 方式 ， 在 这 部 分 内 容 中 我 们 会 了 解 到 如 下 内 容 。 

口 诸如 散 列 表 这 样 的 主 索引 结构 将 表 中 各 行 安排 在 计算 机 的 内 存 中 ,合适 的 结构 可 以 提高 
诸多 操作 的 效率 (8.4 节 )。 

口 辅助 索引 提供 了 额外 的 结构 ， 而 且 有 助 于 高 效 执行 其 他 操作 ( 8.5 节 和 8.6 节 )。 
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第 三 个 主题 是 一 种 非常 高 级 的 表示 “查询 ”的 方式 ， 其 中 查询 是 指 与 表 集 合 中 的 信息 有 关 
的 问题 ， 这 部 分 有 以 下 要 点 。 
口 关系 代数 是 一 种 强大 的 表示 法 ， 可 以 在 不 给 出 运算 执行 细节 的 情况 下 表示 查询 (8.7 节 )。 
口 关系 代数 的 运算 符 可 以 用 本 革 讨 论 的 数据 结构 来 实现 (8.8 市 )。 
口 为 了 迅速 得 出 用 关系 代数 表示 的 查询 的 解答 , 通常 有 必要 对 它们 加 以 “优化 ”, 也 就 是 说 ， 
使 用 代数 法 则 将 一 个 表达 式 转 换 成 有 着 更 快 求 值 策略 的 等 价 表 达 式 。 我 们 将 在 8.9 市 中 了 
解 一 些 这 样 的 技巧 。 


8.2 关系 


7.7 节 介绍 的 “关系 ”的 概念 是 元 组 的 集合 。 关 系 中 的 每 个 元 组 都 是 一 列 组 分 ， 而 每 个 关系 
都 具有 固定 的 元 数 ， 它 表示 每 个 元 组 中 所 含 组 分 的 数量 。 尽 管 我 们 主要 研究 了 二 元 关系 ， 也 就 
是 元 数 为 2 的 关系 ， 但 也 说 过 其 他 元 数 的 关系 不 仅 存 在 ， 而 且 相 当 实 用 。 

关系 模型 中 用 到 的 “关系 ”的 概念 与 关系 的 集合 论 定 义 是 紧密 相关 的 ， 但 在 某 些 细节 上 存 
在 差异 。 在 关系 模型 中 , 信息 被 存储 在 如 图 8-1 所 示 的 表 中 。 图 中 的 表 所 表示 的 数据 可 能 存储 在 
教务 老师 的 计算 机 中 ， 是 与 课程 、 选 择 这 些 课程 的 学 生 以 及 他 们 所 取得 的 成 绩 有 关 的 信息 。 

表 中 的 列 都 被 给 定 了 名 称 ， 这 些 名 称 就 叫做 属性 (attribute )。 在 图 8-1 中 ， 属 性 分 别 有 课 程 
(Course )、 学 号 (StudentID ) 和 成 绩 ( Grade )。 






































CS101 12345 A 

CS101 67890 B 

EE200 12345 C 

EE200 22222 B+ 

CS101 33333 A- 

PH100 67890 C+ 
图 8-1 信息 表 





作为 集合 的 关系 与 作为 表 的 关系 


在 关系 模型 中 ， 正 如 我 们 在 7.7 节 中 对 集合 论 关 系 的 讨论 那样 ， 关 系 也 是 元 组 的 集合 。 因 
此 ， 表 中 各 行 排列 的 次 序 是 不 重要 的 ， 可 以 随意 重新 排列 表 中 各 行 而 不 会 改变 表 的 值 ， 就 像 重 
新 排列 集合 中 元 素 的 次 序 而 不 改变 集合 的 值 那样 。 

表 的 每 一 行 中 各 组 分 的 次 序 则 是 关键 的 ， 因 为 不 同 的 列 有 着 不 同 的 名 称 , 而 且 每 个 组 分 所 
表示 的 项 ， 必 须 具 有 该 列 标题 所 指示 的 类 型 。 不过， 在 关系 模型 中 ， 可 以 将 一 整 列 连同 标题 的 
名 称 一 起 改变 次 序 , 这 样 就 能 保持 该 关系 不 发 生变 化 。 数 据 库 关系 在 这 方面 与 集合 论 关系 不 同 ， 
不 过 我 们 很 少 会 重新 排列 表 中 的 列 ， 因 此 可 以 保留 同样 的 术语 。 为 了 避免 疑问 ， 本 章 中 的 术语 
“关系 ”总 是 具有 数据 库 的 含义 。 








表 中 各 行 被 称 为 元 组 ， 且 表示 基本 事实 。 第 一 行 ，(CS101，12345，A)， 表 示 学 号 12345 的 
学 生 在 课程 CS101 中 得 了 A。 


8.2 关系 327 





表 包 含 两 个 方面 。 

(1) 列 名 的 集合 ; 

(2) 包含 信息 的 行 。 
术语 “关系 ” 指 的 是 后 者 ， 也 就 是 行 的 集合 。 每 一 行 表示 关系 的 一 个 元 组 ， 而 且 这 些 行 在 表 中 
出 现 的 次 序 是 无 关 紧 要 的 。 相 同 表 中 不 存在 各 列 的 值 全 部 相同 的 两 行 。 

第 (1) 项 ， 列 名 ( 属性 ) 的 集合 被 称 为 关系 的 模式 ( scheme )。 属 性 在 模式 中 出 现 的 次 序 无 
关 紧 要 ， 不 过 为 了 正确 地 写 出 元 组 ， 需 要 知道 属性 与 表 中 的 列 之 间 的 对 应 关系 。 我 们 通常 会 使 
用 模式 作为 关系 的 名 称 。 因 此 ,图 8-1 中 的 表 通 常 称 为 “课程 -学 号 -成 绩 ” 关 系 。 此 外 ， 还 可 以 
用 首 字 母 缩写 CSG 来 为 该 关系 命名 。 


8.2.1 关系 的 表示 


就 像 集合 那样 ， 用 数据 结构 表示 关系 的 方式 也 多 种 多 样 。 表 的 各 行 就 应 该 是 结构 体 ， 其 中 
各 个 字段 与 各 列 名 相对 应 。 例 如 ， 图 8-1 所 示 关 系 中 的 元 组 可 以 表示 为 如 下 类 型 的 结构 体 。 
struct CSG { 
char Course[5] ; 
int StudqentId ; 
char Graqe [2] ; 
上 
表 本 里 可 以 从 多 种 方式 中 任 选 其 一 来 表示 ， 比 如 
(1) 该 类 型 结构 体 组 成 的 数组 。 
(2) 该 类 型 结构 体 组 成 的 链表 ， 其 中 还 要 有 链接 链表 各 单元 的 next 字 段 。 
此 外 ， 也 可 以 将 一 个 或 多 个 属性 视 为 该 关系 的 “定义 域 "， 而 将 其 余 属 性 视 作 “ 值 域 "。 例 如 ， 
图 8-1 中 的 关系 可 以 被 看 作 从 定义 域 “ 课 程 ”到 由 “学 号 =- 成绩” 有 序 对 组 成 的 值 域 的 关系 。 然 
后 可 以 按照 7.9 节 中 讨论 过 的 二 元 关系 的 模式 ， 将 该 关系 存储 在 散 列 表 中 。 也 就 是 说 ， 我 们 会 散 
列 “ 课 程 ” 的 值 ， 而 存储 在 散 列 表 元 中 的 元 素 是 “课程 -学 号 -成 绩 ” 三 元 组 。 我 们 将 从 8.4 中 起 
更 为 详细 地 讲解 表示 关系 的 数据 结构 的 这 一 问题 。 


8.2.2 ”数据 库 


关系 的 集合 称 为 数据 库 。 在 为 某 些 应 用 设计 数据 库 时 ， 首 移 要 做 的 就 是 决定 竺 存储 的 数据 该 
如 何 安排 在 表 中 。 与 所 有 设计 问题 一 样 ， 数 据 库 的 设计 也 是 个 业务 需求 和 判断 的 问题 。 在 接 下 来 
的 示例 中 , 我 们 将 扩展 这 里 涉及 谍 程 的 教务 数据 库 应 用 , 而 且 要 揭示 优秀 数据 库 设 计 的 一 些 原 则 。 

数据 库 最 强大 的 那些 操作 涉及 将 若干 关系 用 来 表示 协调 的 数据 类 型 。 通 过 建立 恰当 的 数据 
结构 ， 可 以 高 效 地 从 一 个 关系 跳 转 到 为 一 个 关系 ， 从 而 从 数据 库 中 获取 一 些 无 法 从 单个 关系 发 
现 的 信息 。 与 关系 间 “ 导 航 ” 相 关 的 数据 结构 和 算法 将 在 8.6 节 和 8.8 节 中 加 以 介绍 。 

数据 库 中 各 关系 的 模式 组 成 的 集合 就 是 数据 库 的 模式 。 要 注意 数据 库 模 式 〈 它 告诉 我 们 与 
数据 库 中 信息 组 织 方式 有 关 的 信息 ) 与 各 关系 中 元 组 的 集合 〈 数据 库 中 存储 的 实际 信息 ) 之 间 
的 区 别 。 


+ 示例 8.1 
我 们 为 图 8-1 中 具有 模式 {课程 ， 学 号 ， 成 绩 } 的 关系 补充 4 个 其 他 的 关系 ， 它 们 的 模式 和 直 
观 意义 如 下 。 
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(1) {学 号 ， 姓名， 地 址 ， 电 话 }。 学 生 的 学 号 出 现在 元 组 的 第 一 个 组 分 ， 而 姓名 、 地 址 和 电 
话 号 码 分 别 出 现 在 第 二 、 第 三 和 第 四 个 组 分 中 。 

(2) {课程 ， 前 提 }。 该 元 组 第 二 个 组 分 表示 的 课程 ， 是 选修 第 一 个 组 分 所 表示 课程 的 前 提 。 

(3) {课程 ， 日子， 时刻}。 第 一 个 组 分 表示 的 课程 ， 是 在 由 第 二 个 组 分 指定 的 日 子 , 第 三 个 
组 分 给 出 的 时 刻 上 课 。 

(4) {课程 ， 教 室 }。 第 一 个 组 分 表示 的 课程 是 在 第 二 个 组 分 表示 的 教室 上 课 。 

这 4 个 模式 ， 加 上 之 前 提 到 的 4 课程 ,学 号 , 成绩 } 模 式 ， 就 构成 了 用 于 本 章 示 例 的 数据 库 模 
式 。 我 们 还 需要 一 个 表示 数据 库 可 能 的 “当前 值 ”的 示例 。 图 8-1 给 出 了 “课程 -学 号 -成 绩 ” 关 
系 的 一 个 例子 ， 而 对 应 其 他 4 个 模式 的 示例 关系 如 图 8-2 所 示 。 请 记 住 ， 这 些 关 系 远 比 我 们 在 现 
实 中 遇 到 的 关系 简短 ， 在 这 里 只 是 需要 提供 一 些 对 应 这 些 模式 的 样本 元 组 而 已 。 

















姓 名 地 址 电 话 
C.Brown 12 Apple St. 555-1234 





L.Van Pelt 34 Pear Ave. 555-5678 
P.Patty 56 Grape Blvd. 555-9999 


(a) 学 号 -姓名 -地 址 -电话 











(b) 课程 -前 提 











Turing Aud. 
25 Ohm Hall 
Newton Lab 


(d) 课程 -教室 
图 8-2 ”样本 关系 
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8.2.3 数据库 的 查询 


我 们 在 第 7 章 中 看 到 过 对 关系 和 函数 执行 的 一 些 特别 重要 的 操作 ， 虽 然 根据 处 理 的 是 词典 、 
函数 或 是 二 元 关系 ， 它 们 相应 的 意义 会 有 所 区 别 ， 但 这 些 操作 都 名 为 插入 、 删 除 和 查找 。 我 们 
能 对 数据 库 关 系 ， 特 别 是 对 两 个 或 多 个 关系 的 结合 ， 执 行 大 量 的 操作 ， 而 且 8.7 节 中 还 会 概述 对 
两 个 或 多 个 关系 的 结合 执行 的 操作 。 不 过 现在 让 我 们 将 注意 力 集中 在 对 单一 关系 执行 的 基本 操 
作 上 。 这 些 操作 是 对 第 7 章 中 讨论 过 的 那些 操作 的 自然 概括 。 

(1) insert(t,R)。 如 果 元 组 t 尚 未 出 现在 关系 R 中 ， 就 将 它 添加 到 RR 中。 该 操作 与 词典 或 二 元 关 

系 的 插入 操作 有 着 相同 的 精神 。 
(2) delete(X,R)。 在 这 里 ，X 是 某 些 元 组 的 规范 。 它 是 由 对 应 R 各 属性 的 组 分 组 成 的 ， 每 个 组 
分 都 会 是 下 面 两 者 之 一 。 
(a) 一 个 值 。 
(b) 符号 *， 表 示 可 以 接受 任意 值 。 
该 操作 的 效果 是 删除 满足 规范 X 的 所 有 元 组 。 例 如 ， 如 果 要 取消 课程 CS101， 就 要 从 课 
程 -日 子 -时 刻 关 系 中 删除 所 有 课程 属性 为 “CS101” 的 元 组 。 我 们 可 以 用 
Lookup((“CS101”, *, 8)， 课 程 - 日 子 - 时 刻 ) 
表示 这 种 情况 。 该 操作 会 删除 图 8-2(c) 中 的 前 3 个 元 组 , 因为 它们 的 第 一 个 组 分 与 该 规范 的 
第 一 个 组 分 有 着 相同 的 值 ， 而 且 它 们 的 第 二 和 第 三 个 组 分 也 都 像 任意 值 那样 能 与 * 匹 配 。 
(3) lookup(X,R)。 该 操作 的 结果 是 得 到 R 中 匹配 规范 X 的 元 组 形成 的 集合 ，X 是 个 象征 性 的 元 
组 ， 就 跟 第 (2) 项 中 描述 的 一 样 。 例 如 ， 如 果 我 们 想 要 知道 哪些 课程 是 以 CS101 为 前 提 ， 
就 可 以 询问 

















lookup ((*"CS101")， 课 程 -前 提 ) 
结果 是 由 两 个 与 条 件 匹 配 的 元 组 (CS120，CS101) 和 (CS205，CS101) 组 成 的 集合 。 


+ 示例 8.2 
下 面 有 更 多 对 教务 数据 库 进行 操作 的 例子 。 

(a) lookup(("CS101",12345*)， 课 程 - 学 号 -前 提 ) 可 以 找到 学 号 为 12345 的 学 生 CS101 
课程 的 成 绩 。 正 式 地 讲 ， 得 到 的 结果 只 有 一 个 匹配 的 元 组 ， 也 就 是 图 8-1 中 的 第 一 个 
元 给。 

(b) lookup(("CS205","CS120")， 课 程 -前提 ) 会 询问 CS120 是 否 为 CS205 的 前 提 。 正 式 地 
讲 ， 如 果 元 组 ("CS205","CS120") 在 该 关系 中 ， 产 生 的 回答 就 是 该 元 组 ， 如 果 该 元 组 
不 在 该 关系 中 ， 那 么 回答 就 是 空 集 。 对 图 8-2b 中 的 关系 而 言 ， 得 到 的 回答 是 空 集 。 

(c) delete(("CS101"*)， 课 程 - 教 室 ) 会 吻 除 图 8-2d 中 的 第 一 个 元 组 。 

(qd) insert(("CS205","CS120")， 课 程 -~ 前提) 会 使 CS120 成 为 CS205 的 前 提 。 

(e) insert(("CS205","CS101")， 课 程 -前 提 ) 不 会 对 图 8-2b 的 关系 造成 影响 ， 因 为 要 插入 
的 元 组 已 经 在 该 关系 中 了 。 


8.2.4 ”表示 关系 的 数据 结构 的 设计 
在 本 章 接 下 来 的 部 分 中 ,有 大 量 篇 幅 用 来 讨论 如 何 为 关系 选择 数据 结构 的 问题 。 在 7.9 方 中 
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讨论 二 元 关系 的 实现 时 , 我 们 已 经 见识 过 有 关 该 问题 的 一 些 内 容 。 我 们 为 品种 -传粉 者 关系 给 定 

了 一 个 有 关 品 种 的 散 列 表 作 为 其 数据 结构 ， 而 且 我 们 看 到 该 结构 在 回应 诸如 
1ookup(("Wickson"*)， 品 种 一 传粉 者 ) 

这 样 的 查询 时 会 非常 实用 ， 因 为 值 “Wickson” 让 我 们 找到 了 有 待 查找 的 特定 散 列 表 元 。 不 过 该 

结构 对 回应 诸如 





1ookup((*%"Wickson")， 品 种 一 传粉 者 ) 

这 样 的 查询 是 无 所 帮助 的 ， 因 为 我 们 必须 要 在 所 有 的 散 列 表 元 中 查找 。 

有 关 品 种 的 散 列 表 是 否 为 合适 的 数据 结构 ， 取 决 于 预期 的 查询 组 合 。 如 果 我 们 预期 品种 总 
是 已 指定 的 ， 那 么 散 列 表 就 是 合适 的 ， 而 如 果 预 期 品种 有 时 候 是 未 指定 的 ， 就 如 先前 的 查询 那 
样 ， 那 么 就 需要 设计 一 种 更 强大 的 数据 结构 。 

数据 结构 的 选择 是 我 们 在 本 章 中 要 面 对 的 基本 设计 问题 之 一 。 在 8.3 节 中 ， 我 们 要 推广 7.8 
节 和 7.9 节 中 用 于 男 数 和 二 元 关系 的 基本 数据 结构 ， 从 而 让 一 些 属 性 要 么 在 定义 域 中 ， 要 么 在 值 
域 中 。 这 些 结构 将 被 称 为 “ 主 索 引 结构 "。 然 后 ， 在 8.5 闻 中 要 介绍 “辅助 索引 结构 ” ， 它 们 是 让 
我 们 能 高 效 回 应 更 多 种 类 查询 的 额外 的 结构 。 到 那 时 ， 我 们 就 将 看 到 如 何 能 让 上 述 两 个 查询 以 
及 其 他 与 品种 -传粉 者 关系 有 关 的 查询 得 到 高 效 回应 , 也 就 是 说 , 大 约 在 列 出 所 有 这 些 回应 所 花 
的 这 段 时 间 内 。 














设计 1: 数据 库 模 式 的 选择 

在 使 用 关系 数据 模型 时 ， 如 何 选 择 合 适 的 数据 库 模 式 是 个 重要 的 问题 。 例 如 ,为 什么 我 们 

要 把 与 课程 有 关 的 信息 分 为 5 个 关系 ,而 不 是 将 其 放 在 具有 以 下 模式 的 一 张 表 中 
{课程 ， 学 号 ， 成绩， 前 提 ， 日 子 ， 时 刻 ， 教 宝 } 

直觉 上 的 原因 在 于 下 列 两 点 。 

口 如 果 将 两 个 独立 类 型 的 信息 结合 成 一 个 关系 模式 ， 就 可 能 被 迫 多 次 重复 同样 的 事实 。 

例如 ,与 课程 有 关 的 前 提 信 息 ， 是 独立 于 日 子 和 时 刻 信息 的 。 如 果 我 们 将 前 提 信 息 与 日 子 
-时 刻 信息 结合 在 一 起 ， 就 不 得 不 在 列 出 某 课 程 的 前 提 时 还 要 加 上 每 次 上 课 的 时 间 , 反之 亦 然 。 
那么 ， 如 果 将 图 8-2b 和 图 8-2c 中 有 关 课 程 EE200 的 数据 放 在 具有 {课程 ， 前 提 ， 日 子 ， 时 刻 } 模 
式 的 单一 关系 中 ， 就 成 了 





课程 前 提 日 子 时 刻 

EE200 EEO0S Tu 10AM 

EE200 EEO0S W 1PM 

EE200 EEO0S Th 10AM 

EE200 CS100 Tu 10AM 

EE200 CS100 W 1PM 

EE200 CS100 Th 10AM 
请 注意 ， 要 完成 之 前 各 含 2 到 3 个 组 分 的 5 个 元 组 就 能 完成 的 工作 ， 这 里 要 用 到 6 个 元 组 ， 
而 且 每 个 元 组 有 4 个 组 分 。 


口 反 过 来 ， 在 属性 表示 相互 联系 的 信息 时 ， 不 要 把 它们 分 开 。 

例如 ， 我 们 不 能 把 “课程 -日 子 -时 刻 ” 关 系 赫 代为 分 别 具 有 “课程 -日 子 ”模式 和 “课程 
-时 刻 ” 模 式 的 两 个 关系 。 因 为 那样 的 话 ， 我 们 只 能 告知 FE200 会 在 星期 二 、 星 期 三 和 星期 四 上 
课 ， 而 且 会 在 上 午 10 点 及 下 午 1 点 上 课 ， 但 没 办 法 说 明 这 3 天 分 别 是 在 几 点 上 课 。 
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8.2.5 “习题 


(1) 为 图 8-2a 到 图 8-2d 的 这 些 关 系 中 的 元 组 给 出 合适 的 结构 体 声明 。 
(2)* 对 以 下 问题 来 说 ,合适 的 数据 库 结 构 是 什么 ? 
(a) 电话 籍 ， 包 含 电话 敌 中 所 有 常见 信息 ， 比 如 区 号 。 
(b) 英语 词典 ， 包含 词典 中 所 有 常见 信息 ， 比 如 词 源 和 词性 。 
(c) 日 历 ， 包含 日 历 中 所 有 常见 信息 ， 比 如 节假日 ， 要 含有 从 公元 1 年 到 公元 4000 年 的 所 有 内 容 。 


8.3 键 


很 多 数据 库 关 系 可 被 视 作 从 菏 些 属性 的 集合 到 其 余 属性 的 函数 。 例 如 ， 我 们 可 将 “ 诬 程 - 
学 号 -成 绩 ” 关 系 看 作 定 义 域 为 “ 谋 程 -学 号 ”有 序 对 ， 值 域 为 成 绩 的 函数 。 因 为 函数 的 数据 结 
构 比 一 般 关 系 的 数据 结构 多 少 要 简单 一 些 , 所 以 如 果 我 们 知道 可 以 作为 函数 定义 域 的 属性 集合 ， 
是 能 派 上 用 场 的 。 这 样 的 属性 集合 就 叫 作 “ 键 ”。 

更 正式 地 讲 , 关系 的 键 是 一 项 或 多 项 属性 的 集合 , 它 满足 这 样 的 条 件 , 就 是 在 任何 情况 下 ， 
以 键 属性 为 标题 的 列 中 不 会 出 现 相同 的 值 。 通 常 ， 有 很 多 不 同 的 属性 集合 可 以 作为 关系 的 键 ， 
不 过 我 们 一 般 只 选择 一 个 ， 并 称 为 “ 键 ”。 


8.3.1 键 的 确定 


因为 键 可 以 用 作 函 数 的 定义 域 , 所 以 它们 在 8.4 节 中 讨论 主 索引 结构 时 扮演 了 重要 角色 。 一 
般 而 言 ， 我 们 没 法 证 实 或 证 明 属 性 集合 可 以 形成 键 ， 而 是 需要 小 心地 检查 与 要 建 模 的 应 用 有 关 
的 假设 ， 以 及 这 些 假设 如 何 反映 在 我 们 设计 的 数据 库 模 式 中 。 只 有 这 样 才 能 知道 给 定 的 属性 集 
合 是 否 适 合作 为 键 。 接 下 来 有 一 系列 的 示例 用 来 说 明 一 些 问题 。 


+ 示例 8.3 

考虑 图 8-2a 中 的 “学 号 -姓名 -地 址 -电话 ”关系 。 显 然 ， 每 个 元 组 都 是 用 来 表示 不 同学 生 的 
信息 的 。 我 们 不 希望 找到 两 个 具有 相同 学 号 的 元 组 ， 因 为 这 一 编号 存在 的 意义 就 是 要 为 每 个 学 
生 指定 一 个 唯一 的 标识 符 。 如 果 让 同一 个 关系 中 有 了 两 个 学 号 相同 的 元 组 ， 那 么 其 中 有 一 个 就 
是 出 错 了 。 

(1) 如 果 两 个 元 组 所 有 的 组 分 都 相同 , 那么 就 违背 了 关系 是 集合 的 假设 ,因为 集合 中 每 个 元 
素 最 多 只 能 出 现 一 次 。 

(2) 如 果 两 个 元 组 有 着 相同 的 学 号 ， 但 在 姓名 、 地 址 或 电话 这 3 列 中 至 少 有 一 个 不 同 ， 就 说 
明 数 据 存 在 错误 。 要 么 是 我 们 给 了 不 同 的 学 生 同 一 个 学 号 ( 如 果 元 组 中 的 “姓名 ”有 区 别 ), 或 
是 错 给 同一 个 学 生 记 录 了 两 个 不 同 的 地 址 和 (或) 电话 号 人 码 。 
因此 ,将 “学 号 ”属性 作为 “学 号 -姓名 -地 址 -电话 ”关系 的 键 是 合理 的 。 

不 过 , 要 将 “学 号 ”声明 为 键 ,就 要 作出 一 项 关键 的 假设 , 就 是 在 之 前 的 第 (2) 项 中 阐明 的 ， 
决 不 会 为 同一 个 学 生存 储 两 个 姓名 、 地 址 或 电话 号 码 。 不 过 我 们 还 可 能 作出 其 他 的 决定 ,例如 
为 每 个 学 生存 储 家 庭 地 址 和 校园 地 址 。 如 果 这 样 的 话 ， 就 最 好 将 该 关系 设计 成 具有 5 项 属性 , 将 
“地 址 ”属性 替换 为 家 庭 地 址 (HomeAddress ) 和 本 地 地 址 〈LocalAddress ) 这 两 个 属性 ， 而 不 
是 为 每 个 学 生 使 用 两 个 只 有 地 址 组 分 不 同 的 元 组 ,因为 那样 的 话 学 号 就 不 再 能 作为 键 了 , 而 {学 
号 ， 地 址 } 就 能 作为 键 。 
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+ 示例 8.4 

审视 图 8-1 中 的 “课程 -学 号 -成 绩 ” 关 系 ， 我 们 可 能 想 将 “成 绩 ” 作 为 键 ， 因 为 表 中 没有 两 
个 元 组 的 成 绩 是 相同 的 。 不过， 这 种 推理 是 不 合理 的 。 在 这 个 只 有 6 个 元 组 的 示例 中 ,确实 没有 
两 个 元 组 具有 相同 的 成 绩 ， 不 过 在 常见 的 “课程 -学 号 -成 绩 ” 关 系 中 ， 可 能 有 着 成 千 上 万 个 元 
组 ， 肯 定 有 很 多 成 绩 会 出 现 多 次 。 

最 有 可 能 的 是 ， 数 据 库 设计 人 员 的 想法 是 用 “课程 ”和 “学 号 ”这 两 个 属性 一 起 形成 键 。 
也 就 是 说 ， 假 设 学 生 不 可 能 选修 同一 课程 两 次 ， 因 此 ， 不 可 能 出 现 课程 与 学 号 都 相同 的 两 个 不 
同 元 组 。 因 为 我 们 预见 可 以 找 出 多 个 具有 相同 “课程 ”组 分 的 元 组 ， 以 及 很 多 有 着 同样 “学 号 ” 
组 分 的 元 组 ， 所 以 “课程 ”和 “学 号 ”都 不 能 单独 作为 键 。 

不 过 ， 学 生 在 任意 课程 中 只 可 以 获得 一 个 成 绩 的 假设 也 是 有 竺 推 殴 的 ， 这 取决 于 学 校 的 具 
体 政策 。 也 许 在 课程 内 容 发 生 重 大 改变 时 ， 学 生 可 以 重新 注册 该 课程 。 如 果 有 这 种 情况 ， 就 不 
能 将 {课程 , 学 号 } 声 明 为 “课程 -学 号 -成 绩 ” 关系 的 键 , 只 有 全 部 3 个 属性 的 集合 才 可 以 作为 键 。 
请 注意 ， 具 有 关系 中 所 有 属性 的 集合 总 能 作为 键 ， 因 为 关系 中 不 可 能 出 现 两 个 相同 的 元 组 。 事 
实 上 ， 最 好 是 添加 第 四 项 属性 ， 日 期 来 表示 课程 被 选择 的 时 间 ， 这 样 一 来 就 可 以 处 理学 生 选 了 
同样 课程 两 次 并 且 两 次 都 获得 相同 成 绩 的 情况 了 。 


+ 示例 8.5 
在 图 8-2b 的 “课程 ~- 前提” 关系 中 ， 两 项 属性 都 不 能 单独 作为 键 , 不 过 两 项 属性 一 起 就 能 形 
成 键 。 


+ 示例 8.6 

在 图 8-2c 所 示 的 “课程 ~- 日子- 时刻 ”关系 中 ， 全 部 3 项 属性 一 起 形成 了 唯一 合理 的 键 。 可 能 
只 要 课程 和 日 子 加 在 一 起 就 能 声明 为 键 , 不 过 这 样 就 没 法 存储 同一 天 中 要 出 现 两 次 的 课程 了 ( 比 
如 演讲 和 实验 )。 
































设计 ll: 键 的 选择 


为 关系 确定 键 是 数据 库 设计 中 的 一 个 重要 方面 ， 当 我 们 在 8.4 节 中 选择 主 索引 结构 时 就 会 
用 到 。 
口 不 能 只 靠 观察 关系 的 几 个 示例 值 就 确定 键 。 
也 就 是 说 ,外 表 可 能 有 欺骗 性 ,就 像 我 们 在 示例 8.4 中 讨论 过 的 ， 图 8-1 所 示 “ 课 程 -学 号 -成 绩 ” 
关系 中 的 “成 绩 ” 属 性 那样 。 
口 不 存在 所 谓 的 “正确 的 ” 键 选择 ， 选 择 什么 属性 作为 键 ， 取决 于 对 关系 所 含 数据 的 类 型 
作出 的 假设 。 





+ 示例 8.7 

最 后 ， 考 虑 一 下 图 8-2d 中 的 “课程 -教室 ”关系 。 我 们 认为 “课程 ”可 以 作为 键 ， 也 就 
是 说 ， 不 会 有 课程 会 在 两 个 或 多 个 不 同 的 教室 中 进行 。 如 果 情 况 不 这 样 ， 就 应 该 将 “课程 - 
教室 ”关系 与 “课程 ~- 日子- 时 刻 ” 关 系 结合 起 来 ,这样 就 可 以 区 分 一 门 课程 是 在 哪 间 教室 里 
上 课 了 。 
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8.3.2 ”习题 


(1) * 假设 我 们 想 为 “学 号 -姓名 -地 址 -电话 ”关系 中 的 学 生 分 别 存储 家 庭 地 址 及 本 地 地 址 ， 以 及 家 

庭 电 话 及 本 地 电话 。 

(a) 这 样 一 来 ， 该 关系 最 为 合适 的 键 是 什么 ? 

(b) 这 一 改变 会 带 来 元 余 , 例如 , 如 果菜 学 生 的 两 个 地 址 和 两 个 电话 号 码 以 所 有 可 能 的 方式 结合 后 
出 现在 不 同 元 组 中 ， 那 么 该 学 生 的 姓名 就 会 重复 4 次 。 我 们 在 示例 8.3 中 提供 过 一 种 解决 方案 ， 
就 是 使 用 不 同 的 属性 来 表示 不 同 的 地 址 和 不 同 的 电话 。 那 么 这 样 一 来 关系 模式 会 是 怎样 的 ? 而 
这 一 关系 最 合适 的 键 是 什么 ? 

(c) 8.2 节 中 介绍 过 另 一 种 处 理 元 余 的 方式 ， 就 是 将 该 关系 分 解 成 两 个 具有 不 同 模式 的 关系 ， 一 起 
存放 原 关 系 的 所 有 信息 。 如 果 要 为 同一 学 生存 储 多 个 地 址 和 电话 ， 应 该 将 “学 号 -姓名 -地 址 - 
电话 ”关系 分 解 为 哪 几 个 关系 ? 提示 : 关键 问题 在 于 地 址 和 电话 是 否 为 独立 的 。 也 就 是 说 ， 
是 否 期 望 一 个 电话 号 码 会 在 某 学 生 的 所 有 地 址 都 能 接 通 ( 在 地 址 和 电话 相互 独立 的 情况 下 ) ， 
还 是 说 电话 号 码 是 与 单个 地 址 相关 联 的 。 

(2)* 车 管 所 维护 着 含有 如 下 若干 类 信息 的 数据 库 。 

口 驾驶 员 的 姓名 (Name ) 。 

口 芍 驶 员 的 地 址 (Addr ) 。 

口 芍 驶 员 的 驾驶 证 编号 ( LicenseNo ) 。 

口 车 辆 的 序列 号 ( SerialNo ) 。 

口 车 辆 的 生产 商 《Manf) 。 

口 车 辆 的 型 号 名 称 〈Model ) 。 

口 车 辆 的 注册 (车牌 ) 号 (RegNo ) 。 

车 管 所 希望 将 每 个 驾驶 员 关 联 到 相关 信息 : 地 址 、 驾 驶 证 和 所 拥有 的 车 辆 。 还 希望 将 每 辆 车 关联 

到 相关 信息 : 所 有 者 、 序 列 号 、 生 产 商 、 型 号 和 注册 号 。 我 们 假设 熟悉 车 管 所 运作 的 基本 要 求 ， 

例如 ,不 可 能 将 同样 的 车 牌 发 给 两 辆 汽车 。 大 家 可 能 不 知道 (但 这 确实 是 事实 ) ， 即 便 是 来 自 不 

同 生产 商 的 两 辆 汽车 ， 也 不 可 能 具有 同样 的 序列 号 。 

(a) 选择 数据 库 模式 , 也 就 是 关系 模式 的 集合 , 其 中 每 个 关系 模式 都 由 上 面 列 出 的 从 1 到 7 这 几 种 属 
性 的 集合 组 成 。 大 家 必须 让 所 需 的 联系 都 可 以 通过 存储 在 这 些 关 系 中 的 数据 体现 出 来 , 而 且 必 
须 避 免 元 余 ， 也 就 是 说 ， 大 家 设计 的 模式 不 应 该 重复 存储 相同 的 事实 。 

(b) 说 明 哪 些 属性 可 以 作为 (a) 小 题 中 设计 的 关系 的 键 。 


8.4 关系 的 主要 存储 结构 


在 7.8 节 和 7.9 节 中 , 我 们 看 到 如 何 通 过 根据 有 序 对 的 定义 域 值 存储 有 序 对 , 以 使 对 函数 和 二 
元 关系 的 菏 些 操作 提速 。 在 提 到 我 们 在 8.2 节 中 定义 的 一 般 的 插入 、 删 除 和 查找 操作 时 ,能 有 所 
帮助 的 是 那些 指定 了 定义 域 值 的 操作 。 再 次 回想 一 下 7.9 节 中 的 “品种 -传粉 者 ”关系 ， 如 果 将 
品种 作为 关系 的 定义 域 ， 就 有 利于 那些 指定 了 品种 而 不 关心 是 否 指定 了 传粉 者 的 操作 。 

这 里 有 一 些 可 用 于 表示 关系 的 结构 。 

(二 又 查找 树 ， 在 定义 域 值 上 有 “小 于 ”关系 以 安排 元 组 的 位 置 ， 可 以 用 来 促进 指定 了 定 
义 域 值 的 操作 。 

(2) 以 定义 域 值 作为 数组 索引 ， 用 作 特 征 向 量 的 数组 有 时 是 有 用 的 。 

(3) 散 列 定义 域 值 以 找到 散 列 表 元 的 散 列 表 是 有 用 的 。 
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(4) 原则 上 讲 , 元 组 组 成 的 链表 是 一 种 候选 结构 。 我 们 将 忽略 这 种 可 能 ， 因 为 它 对 任何 类 型 
的 操作 都 没有 促进 作用 。 

当 关 系 不 是 二 元 关系 时 ， 同 样 的 结构 也 是 可 以 使 用 的 。 定 义 域 不 是 只 有 单个 属性 ， 而 是 可 
能 结合 k 个 属性 , 我 们 将 其 称 为 定义 域 属性 ,或 是 在 明确 所 指 的 是 属性 集合 时 ,将 其 直接 称 为 “ 定 
义 域 "。 这 样 一 来 ， 定 义 域 的 值 就 是 jt 组 ， 各 组 分 对 应 定义 域 的 各 属性 。 而 值 域 属性 是 那些 定 
义 域 属性 之 外 的 属性 。 值 域 值 也 可 以 有 多 个 组 分 ， 每 一 个 部 对 应 着 一 个 值 域 的 属性 。 

一 般 来 说 ， 我 们 必须 选 出 想 要 作为 定义 域 的 那些 属性 。 最 简单 的 情况 是 一 个 属性 或 少量 属 
性 作为 关系 的 键 的 情况 。 这 样 的 话 就 可 以 选择 键 属性 作为 定义 域 ， 而 将 其 余 属 性 作为 值 域 。 在 
没有 键 的 情况 下 (所 有 属性 的 集合 这 种 不 实用 的 键 除外 ), 我 们 可 以 选择 任意 属性 集合 作为 定义 
域 。 例 如 ， 可 以 考虑 期 望 对 该 关系 执行 的 那些 常用 操作 ， 并 选择 预期 经 常 要 指定 的 属性 作为 定 
义 域 。 我 们 很 快 就 将 看 到 一 些 具体 的 例子 。 

一 旦 选择 了 定义 域 , 就 可 以 从 刚 提 到 的 4 种 数据 结构 中 任 选 其 一 表示 该 关系 , 或 者 其 实 也 可 
以 选择 男 一 种 结构 。 不 过 ， 通 常会 选择 以 定义 域 值 作为 索引 的 散 列 表 ， 而 且 我 们 在 这 里 一 般 都 
会 这 么 做 。 

所 选 的 结构 就 称 为 该 关系 的 主 索引 结构 。 形 容 词 “ 主 ” 表 示 元 组 的 位 置 是 由 该 结构 确定 的 。 
索引 则 是 在 给 定 所 需要 的 元 组 的 一 个 或 多 个 组 分 的 情况 下 协助 找到 元 组 的 数据 结构 。 在 8.5 节 
中 ， 我 们 将 讨论 “辅助 ”索引 ， 它 有 助 于 回应 查询 ， 但 不 影响 数据 的 位 置 。 




















typedef struct TUPLE *TUPLELIST; 
struct TUPLE { 
int StudentId; 
char Name[30] ; 
char Address [50]; 
char Phone [8] ; 
TUPLELIST next; 
上 
typedef TUPLELIST HASHTABLE[1009]; 








图 8-3 ”作为 主 索引 结构 的 散 列 表 的 类 型 


+ 示例 8.8 

我 们 来 考虑 一 下 以 “学 号 ”属性 作为 键 的 “学 号 -姓名 -地 址 -电话 ”关系 。 学 号 属性 就 将 
作为 定义 域 , 而 其 他 3 个 属性 则 会 形成 值 域 , 因此 可 以 将 该 关系 视 为 从 学 号 到 “姓名 -地 址 -电话 ” 
三 元 组 的 函数 。 

就 和 所 有 的 函数 那样 ， 我 们 选择 接受 定义 域 值 作为 参数 并 生成 散 列 表 元 号 作为 结果 的 散 列 
函数 。 在 这 种 情况 下 ， 散 列 函数 会 接受 学 生 的 学 号 (整数 ) 作为 参数 。 我 们 将 选择 1009" 作 为 散 
列表 元 的 数量 8， 这 样 散 列 函数 就 是 

h(x) = x%1009 
散 列 函数 将 学 号 映射 到 从 0 到 1008 这 个 范围 的 整数 。 

含 1009 个 散 列 表 元 头 部 的 数组 给 我 们 市 米 了 一 列 列 的 结构 体 。 i 号 散 列 表 元 对 应 的 链表 中 的 

结构 体 表示 的 是 学 号 组 分 除 以 1009 余 数 为 ;的 那些 元 组 。 对 “学 号 -姓名 -地 址 -电话 ”关系 来 说 ， 








GD 1009 是 1000 左 右 的 质数 。 如 果 数 据 库 要 记录 数 千 学 生 的 信息 ， 就 可 以 使 用 1000 个 左右 的 散 列 表 元 ， 这 样 一 来 每 
个 散 列 表 元 中 的 平均 元 组 数 就 会 很 小 。 
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图 8-3 中 的 声明 对 散 列 表 元 链表 中 的 结构 体 和 散 列 表 元 头 部 数组 来 说 都 是 合适 的 。 图 8-4 展 示 了 
散 列 表 看 起 来 的 样子 。 


散 列 表 元 头 部 





12345 _ 237 12345 | C.Brown |12 Apple St.| 555-1234 通 向 237 号 敬 列 表 
元 中 的 其 他 元 组 


1008 
图 8-4 ”表示 “学 号 -姓名 -地 址 -电话 ”关系 的 散 列 表 


+ 示例 8.9 

再 看 一 个 更 复杂 的 例子 ， 考 虑 一 下 “课程 -学 号 -成 绩 ” 关 系 。 我 们 可 以 用 散 列 表 作 为 主 
结构 ， 该 散 列 表 的 散 列 函数 接受 课程 和 学 号 ( 即 构成 该 关系 的 键 的 两 项 属性 ) 作为 参数 。 这 
样 的 散 列 函 数 要 接受 表示 课程 名 称 的 字符 ， 再 加 上 表示 学 生 学 号 的 整数 ， 然 后 再 除 以 1009 取 

如 果 我 们 要 进行 的 操作 都 是 在 给 定 课 程 与 学 号 的 情况 下 查找 成 绩 , 这 一 数据 结构 就 很 实用 。 
也 就 是 说 ， 它 适用 于 执行 如 下 操作 : 

Ilookup((“CS101”, 12345,*), 课 程 - 学 号 - 成 绩 ) 

不 过 它 对 诸如 下 面 这 样 的 操作 来 说 就 不 实用 。 

(1) 找 出 所 有 选修 CS101 课 程 的 学 生 ; 

(2) 找 出 学 号 12345 的 学 生 选 修 的 所 有 课程 。 
在 这 两 种 情况 下， 我 们 都 没 法 计算 散 列 值 。 例 如 ， 只 给 定 课 程 ， 就 没有 学 号 可 加 到 课程 名 字符 
对 应 整数 的 和 上 ， 因 此 就 没有 值 除 以 1009 以 得 出 散 列 表 元 号 。 

不 过 ,假设 经 常 要 进行 “ 谁 选修 了 CS101” 这 样 的 查询 ， 也 就 是 

lookup((“CS101”,*,*), 课 程 - 学 号 - 成 绩 ) 

那么 使 用 只 基于 “课程 ”组 分 的 值 的 主 结构 会 更 有 效 。 也 就 是 说 ， 可 以 将 该 关系 视 作 集合 论 中 
的 二 元 关系 ， 其 中 定义 域 是 课程 ， 而 值 域 则 是 学 号 -成 绩 有 序 对 。 

例如 ， 假 设 我 们 将 课程 名 称 的 字符 转换 成 整数 ， 并 求 出 它们 的 和 ， 除 以 197， 然 后 取 余 数 。 
那么 “课程 -学 号 -成 绩 ” 关 系 的 元 组 就 会 被 该 散 列 函数 分 装 到 标号 为 0 至 196 的 197 个 散 列 表 元 中 。 
不 过 ， 如 果 有 100 个 学 生 选 修了 CS101 课 程 ， 那 么 不 管 我 们 为 散 列 表 安 排 了 多 少 个 散 列 表 元 ， 对 
应 课程 CS101 的 散 列 表 元 中 都 至 少 有 100 个 结构 体 ， 这 就 是 使 用 不 是 键 的 属性 作为 主 索引 结构 的 
定义 域 的 缺点 。 如 果 其 他 课程 也 被 散 列 到 对 应 CS101 的 散 列表 元 ， 那 么 该 散 列 表 元 中 甚至 会 有 
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100 个 以 上 的 结构 体 。 

男 一 方面 ， 当 想 要 在 给 定 的 课程 中 找到 学 生 时 ,仍然 能 从 中 受益 。 如 果 课 程 的 数量 明显 大 
于 197， 那 么 平均 下 来 ， 只 需要 查找 整个 “课程 -学 号 -成 绩 ” 关 系 的 1/1197， 这 是 一 笔 巨 大 的 市 
省 。 此 外 ， 当 我 们 执行 在 特定 课程 中 查找 特定 学 生 的 成 绩 , 或 是 插入 或 删除 “课程 -学 号 -成 绩 ” 
元 组 这 样 的 操作 时 ， 也 会 受益 于 该 结构 。 在 每 种 情况 下 ， 都 可 以 使 用 “课程 ” 值 将 查找 范围 限 
定 在 散 列 表 197 个 散 列 表 元 中 的 某 一 个 上 。 唯 一 帮 不 上 和 忙 的 情况 就 是 处 理 没有 指定 课程 的 操作 。 
例如 ,要 找到 学 生 12345 选 修 的 课程 ,就 必须 查找 所 有 的 散 列 表 元 。 这 样 的 查询 只 有 在 使 用 辅助 
索引 结构 时 才 可 以 更 有 效率 地 进行 ， 这 一 点 会 在 8.5 节 中 讨论 。 




















设计 川 : 主 索引 的 选择 


口 将 关系 模式 的 键 作为 函数 的 定义 域 ， 并 将 其 余 属 性 作为 值 域 通常 是 很 实用 的 。 
然后 就 可 以 像 实现 函数 那样 , 使 用 诸如 带 有 基于 键 属性 的 散 列 函数 的 散 列 表 这 样 的 主 索引 
来 实现 关系 。 
口 不 过 ,如 果 最 常见 的 查询 所 指定 的 是 不 构成 键 的 属性 的 值 , 就 可 能 要 选用 该 属性 集合 作 
为 定义 域 ， 而 将 其 余 属性 作为 值 域 。 
接着 就 可 以 像 实 现 二 元 关系 那样 来 实现 该 关系 了 。 上 比如 ,利用 散 列 表 。 唯一 的 问题 就 在 
于 ,元 组 在 散 列 表 元 中 的 分 布 可 能 不 像 以 键 作 为 定义 域 时 那么 平均 。 
口 主 索引 结构 定义 域 的 选择 可 能 对 执行 “常规 ”查询 的 速度 有 着 最 大 的 影响 。 





8.4.1 插入 、 删 除 和 查找 操作 


鉴于 第 7 草 中 对 二 元 关系 的 同样 主题 的 探讨 , 这 里 用 主 索 引 结 构 执 行 插入 、 删 除 和 查找 操作 
的 方式 应 该 很 明了 。 要 回顾 这 些 概 念 ， 就 要 将 注意 力 放 在 作为 主 索 引 结 构 的 散 列 表 上 。 如 果 操 
作 指 定 了 定义 域 的 值 ， 那 么 束 要 散 列 该 值 以 找到 散 列 表 元 。 

(1) 要 搬入 元 组 !， 就 要 检查 相应 的 散 列 表 元 ， 看 看 十 否 已 经 位 列 其 中 ， 如 果 没 有 就 在 该 散 
列表 元 对 应 的 链表 中 创建 新 单元 来 容纳 i。 

(2) 要 删除 匹配 规范 X 的 元 组 ， 就 要 根据 X 找 出 定义 域 值 ， 进 行 散 列 以 得 出 相应 的 散 列表 元 ， 
然后 治 着 该 散 列 表 元 对 应 的 链表 向 下 查找 ， 将 匹配 规范 XY 的 各 元 组 都 删除 掉 。 

(3) 要 根据 规范 X 查 找 元 组 ， 还 是 要 从 X 找 到 定义 域 值 ， 进 行 散 列 以 得 出 相应 的 散 列 表 元 。 
沿 着 对 应 该 散 列 表 元 的 链表 癌 下 查找 ， 将 链表 中 匹配 规范 X 的 各 元 组 分 别 作为 回应 生成 。 

如 果 操 作 没有 指定 定义 域 值 ， 就 不 会 这 么 走运 了 。 插 入 操作 就 总 是 要 完整 地 指定 被 搬入 的 
元 组 ， 而 删除 或 查找 操作 可 能 不 能 这 样 。 在 那样 的 情况 下 ， 我 们 必须 对 所 有 的 散 列 表 元 列表 进 
行 查 找 ， 找 到 匹配 的 元 组 ， 并 分 别 删除 或 列 出 它们 。 


8.4.2 ”习题 


(1) 8.3 节 中 习题 (2) 的 车 管 所 数据 库 应 该 设计 成 能 处 理 如 下 类 型 的 查询 , 而 且 要 假设 这 些 查 询 发 生 的 频 
率 都 相当 高 。 
(a) 给 定 区 驶 员 的 地 址 是 什么 ? 
(b) 给 定 各 驶 员 的 驾驶 证 编号 是 多 少 ? 
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(c) 给 定 驾 驶 证 编号 对 应 驾驶 员 的 姓名 是 什么 ? 

(d) 拥有 给 定 车 辆 (以 其 注册 号 作为 标识 ) 的 驾驶 员 的 姓名 是 什么 ? 

(e) 具有 给 定 注册 号 的 车 辆 的 序列 号 、 生 产 商 和 型 号 各 是 什么 ? 

(f) 拥有 给 定 注 册 号 所 对 应 车 辆 的 是 谁 ? 
为 自己 在 8.3 节 习题 CD) 中 设计 的 那些 关系 给 出 合适 的 主 索引 结构 ， 每 种 情况 下 都 使 用 散 列 表 。 
陈述 有 关 驾 驶 员 数 与 车 辆 数 的 假设 。 说 出 要 使 用 多 少 散 列 表 元 ， 以 及 要 使 用 什么 属性 作为 定 
义 域 。 这 几 类 查询 中 有 多 少 可 以 得 到 高 效 的 回应 ， 也 就 是 说 ， 平 均 只 花费 0(1) 的 时 间 而 不 用 
考虑 关系 的 大 小 。 

(2) 图 8-2c 中 “课程 -日 子 -时 刻 ” 关 系 的 主 结构 可 能 取决 于 我 们 打算 执行 的 常见 操作 。 如 果 常 需要 执 
行 的 操作 分 别 为 下 面 列 出 的 这 几 类 ， 给 出 合适 的 散 列 表 ， 要 说 清 定 义 域 中 的 属性 以 及 散 列 表 元 的 
数量 。 大 家 可 以 对 课程 的 数量 以 及 不 同 的 上 课时 段 作出 合理 假设 。 在 每 种 情况 下 ， 像 “CS101” 
这 样 的 指定 值 是 用 来 表示 “常见 ” 值 的 ， 这 样 的 话 ， 我 们 的 意思 是 “课程 ”被 指定 为 某 一 特定 的 
课程 。 

(a) lookup(("CS101","M"*)， 课 程 -- 日 子 - 时 刻 ) 。 
(b) 1ookup ((%"M",*,"9AM")， 课 程 -日 子 - 时 刻 ) 。 
(c) Iookup(("CS101",**)， 课 程 -- 日 子 - 时 刻 ) 。 
(d) (a) 类 和 (b) 类 各 占 一 半 。 

(e) (a) 类 和 (c) 类 各 占 一 半 。 

(f(b) 类 和 (c) 类 各 占 一 半 。 


8.5 ”辅助 索引 结构 


假设 把 “学 号 -姓名 -地 址 -电话 ”关系 存储 到 如 图 8-4 所 示 、 散 列 函 数 是 基于 “学 号 ” 键 的 
散 列 表 中 。 该 主 索引 结构 有 助 于 回应 那些 指定 了 学 生 学 号 的 查询 。 不 过 ， 我 们 可 能 希望 以 学 生 
的 姓名 提问 ， 而 不 是 用 客观 而 且 可 能 未 知 的 学 号 提问 。 例 如 ， 我 们 可 能 会 问 ,“ 名 叫 C.Brown 的 
学 生 的 电话 号 码 是 多 少 ? ”这 样 一 来 主 索引 结构 就 帮 不 上 忙 了 。 我 们 必须 行经 每 个 散 列 表 元 ， 
并 检查 一 列 列 的 记录 ， 直 到 找到 “姓名 ”字段 的 值 为 “C.Brown” 的 记录 为 止 。 

要 迅速 回应 这 样 的 查询 ， 就 需要 额外 的 数据 结构 让 我 们 可 以 用 姓名 找到 “姓名 ”组 分 中 含 
有 该 姓名 的 元 组 ”。 可 以 在 给 定 某 一 属性 或 某 些 属性 的 值 的 情况 下 帮 我 们 找到 元 组 , 但 不 能 用 来 
在 整个 结构 中 放置 元 组 的 数据 结构 ， 就 是 辅助 索引 。 

这 里 我 们 需要 的 辅助 索引 是 具备 以 下 两 个 条 件 的 二 元 关系 。 

(1) 定义 域 是 “姓名 ”。 

(2) 值 域 是 指向 “学 号 -姓名 -地 址 -电话 ”关系 的 元 组 的 指针 。 

一 般 而 言 ， 关 系 R 属 性 4 上 的 辅助 索引 是 满足 以 下 条 件 的 有 序 对 (v, p) 的 集合 。 

(a) v 是 属性 4 的 值 。 

(b) p 是 指向 关系 R 主 索引 结构 中 某 个 元 组 的 指针 ， 该 元 组 的 “4” 组 分 的 值 为 v。 
对 属性 4 的 值 为 v 的 各 元 组 来 说 ， 辅 助 索 引 都 有 对 应 的 有 序 对 。 


























J 要 记 住 ,“ 姓 名 ”并 不 是 “学 号 -姓名 -地 址 -电话 ”关系 的 键 ， 尺 管 在 图 8-2a 所 示 的 样本 关系 中 ， 各 元 组 的 姓名 
组 分 的 值 都 是 不 同 的 ,例如 , 如 果 Linus 和 Lucy 上 了 同一 所 大 学 , 那么 就 有 两 个 元 组 的 姓名 组 分 等 于 “L. Van Pelt”， 
但 这 两 个 元 组 的 学 号 组 分 是 不 同 的 。 
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我 们 可 以 使 用 表示 二 元 关系 的 任意 数据 结构 来 存储 辅助 索引 。 通 常会 期 望 使 用 基于 属性 4 
的 值 的 散 列 表 。 只 要 散 列表 元 的 数量 不 大 于 属性 4 不 同 值 的 数量 ， 在 给 定 所 需 的 v 值 的 情况 下 ， 
在 散 列 表 中 查找 有 序 对 (v, p) 通 常 都 可 以 预期 不 错 的 性 能 一 一 也 就 是 平均 O(n/B) 的 时 间 。 这 里 
的 n 是 有 序 对 的 数量 ， 而 8 是 散 列表 元 的 数量 。 为 了 表明 其 他 的 结构 也 可 以 用 于 辅助 索引 (或 主 
索引 )， 我 们 在 下 一 个 示例 中 要 使 用 二 又 查找 树 作 为 辅助 索引 。 

















+ 示例 8.10 

我 们 来 为 图 8-2a 所 示 的 “学 号 -姓名 -地 址 -电话 ”关系 设计 数据 结构 ,其 中 使 用 基于 学 号 的 
散 列 表 作 为 主 索 引 ， 而 使 用 二 又 查找 树 作 为 对 应 姓名 属性 的 辅助 索引 。 为 了 简化 表达 ， 这 里 要 
使 用 只 含 两 个 散 列 表 元 的 散 列 表 作 为 主 结构 , 而 要 使 用 的 散 列 函数 是 用 学 号 除 以 2 的 余数 。 也 就 
是 说 ， 偶 数学 号 会 放 进 0 号 散 列 表 元 ， 而 奇数 学 号 会 放 进 1 号 散 列 表 元 。 





typedef struct TUPLE *TUPLELIST ; 
struct TUPLE { 

int StudentId ; 

char Name[30] ; 

char Address [50] ; 

char Phone [8] ; 

TUPLELIST next; 
上 


typedef TUPLELIST HASHTABLE[2] ; 


typedef struct NODE *TREE; 
struct NODE { 
char Name[30] ; 
TUPLELIST toTuple; /* 其 实 是 指向 元 组 的 指针 */ 
TREE le: 
TREE rc; 











图 8-5 对 应 主 索引 和 辅助 索引 的 类 型 


这 里 将 使 用 二 又 查找 树 作为 辅助 索引 ， 该 二 叉 查 找 树 的 节点 中 存储 着 由 学 生 姓 名 与 指向 元 
组 的 指针 组 成 的 有 序 对 。 元 组 本 身 被 存储 为 记录 ， 这 些 记录 链接 成 链表 ， 构 成 了 散 列表 的 散 列 
表 元 , 所 以 指向 元 组 的 指针 实际 上 就 是 指 癌 记录 的 指针 。 因此, 我 们 需要 如 图 8-5 所 示 的 结构 体 。 
TUPLE 和 HASHTABLE 类 型 与 图 8-3 中 的 定义 是 一 致 的 ， 只 不 过 现在 使 用 的 是 两 个 散 列 表 元 而 不 
是 1009 个 。 

NODE 类 型 是 二 叉 树 的 节点 ， 它 具有 Name 和 tomTup1le 这 两 个 字段 ， 分 别 表 示 该 节点 处 的 元 
素 ( 即 某 一 学 生 的 姓名 )， 以 及 指向 该 学 生 对 应 的 元 组 所 在 记录 的 指针 。 而 其 余 的 两 个 字段 ，1c 
和 zc， 分 别 是 指向 该 节点 左 子 节点 与 右 子 节点 的 指针 。 我 们 会 用 学 生 的 姓 的 字母 表 次 序 作为 比 
较 树 中 接点 处 各 元 素 所 使 用 的 “小 于 ”次 序 。 而 辅助 索引 本 身 是 TREE 类 型 的 变量 ,也 就 是 指 问 
节点 的 指针 ， 它 会 将 我 们 带 到 该 二 又 查找 树 的 根 。 

图 8-6 展 示 了 整个 结构 体 的 一 个 示例 。 为 了 节省 空间 , 元 组 的 地 址 和 电话 组 分 并 没有 表示 出 
来 。 而 图 中 的 Z1 和 Z2 等 字样 表示 主 索引 结构 中 的 记录 在 内 存 中 的 存储 位 置 。 

现在 ， 如 果 想 要 回应 诸如 “PPatty 的 电话 号 码 是 多 少 ” 这 样 的 查询 ， 就 要 从 辅助 索引 的 根 
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开始 ， 查 找 Name 字 段 为 “PPatty” 的 节点 ， 并 跟着 该 指针 到 达 toTup1le 字 段 ， 如 图 8-6 中 的 Z2 
所 示 。 这 样 就 可 以 找到 PPatty 的 记录 ， 并 从 该 记录 查阅 Phone 字 段 并 生成 该 查询 的 回应 。 


散 列 表 
元 基部 











L2 
ood | te an elt 中 22222 PPatty | 。 


了 3 
EEC 


(a) 主 索引 结构 

















L. Van Pelt 





(b) 辅助 索引 结构 
图 8-6_ 主 索引 结构 与 辅助 索引 结构 的 示例 





8.5.1 非 键 字段 上 的 辅助 索引 


看 起 来 在 示例 8.10 中 构建 辅助 索引 所 依据 的 “姓名 ”属性 是 键 ， 因 为 没有 重复 出 现 的 姓名 。 
不 过 ， 正 如 我 们 所 知 ， 存 在 两 个 学 生 同 名 的 可 能 ， 所 以 “姓名 ”其 实 不 是 键 。 正 如 在 7.9 方 讨论 
过 的 ， 虽然 非 键 属性 可 能 让 元 组 在 散 列 表 元 中 的 分 布 不 如 预期 的 那样 平均 ， 但 它 并 不 会 影响 到 
散 列 表 的 数据 结构 。 

二 又 查找 树 是 为 一 个 问题 ， 因 为 这 种 数据 结构 不 能 处 理 不 存在 “小 于 ”关系 的 两 个 元 素 ， 
如 有 果 两 个 有 序 对 有 着 相同 的 姓名 和 不 同 的 指针 ,就 会 出 现 这 种 情况 。 对 图 8-5 所 示 结 构 进行 一 个 
小 的 修正 , 用 字段 LoTuple 作 为 指向 元 组 的 指针 组 成 的 链表 的 表 头 , 具有 Name 字 段 中 给 定 值 的 
各 元 组 都 与 一 个 指针 对 应 。 例 如 ， 如 果 有 很 多 个 PPatty， 那 么 图 8-6b 中 底部 的 节点 就 会 在 Z2 的 
位 置 具有 链表 的 表 头 。 而 该 链表 中 的 元 素 就 是 指向 “姓名 ”属性 等 于 “PPatty” 的 各 元 组 的 
指针 。 
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设计 VI: 何 时 应 该 创建 辅助 索引 ? 


如 果 元 组 的 一 个 或 多 个 组 分 的 值 已 经 给 定 , 辅助 索引 的 存在 通常 会 让 查找 元 组 的 工作 变 得 
更 容易 。 不 过 还 要 考虑 如 下 两 点 。 

口 所 创建 的 每 个 辅助 索引 都 会 让 我 们 在 关系 中 插入 或 删除 信息 时 花费 额外 的 时 间 。 

口 因此 ， 只 为 那些 可 能 需要 查找 数据 的 属性 构建 辅助 索引 是 说 得 通 的 。 
例如 ， 如 果 从 不 打算 在 只 给 定 电话 号 码 的 情况 下 找到 学 生 ， 就 没 必 要 在 “学 号 -姓名 -地 址 - 电 
话 ” 关 系 中 的 “电话 ”属性 上 创建 辅助 索引 。 





8.5.2 ”辅助 索引 结构 的 更 新 


当 某 个 关系 存在 辅助 索引 时 ,元 组 的 插入 和 删除 操作 就 会 变 得 更 困难 。 除 了 要 像 8.4 广 概述 
的 那样 更 新 主 索引 结构 ， 还 可 能 需要 更 新 各 辅助 索引 结构 。 以 下 方法 可 用 来 在 涉及 属性 4 的 元 
组 被 搬入 或 删除 时 更 新 基于 4 的 辅助 索引 结构 。 

(1) 插入 。 如 果 要 插入 一 个 新 元 组 ， 其 对 应 属性 4 的 组 分 的 值 为 x， 就 必须 创建 有 序 对 (v,p)， 
其 中 z 是 指向 主 结构 中 新 记录 的 指针 。 然 后 ， 再 把 有 序 对 (wz) 插 入 到 辅助 索引 中 。 

(2) 删除 。 要 删除 对 应 4 的 组 分 的 值 为 v 的 元 组 时 , 首先 一 定 要 记得 已 经 删除 了 指向 该 元 组 的 
旨 针 ， 比 方 说 是 p。 人 然后， 要 深入 辅助 索引 结构 ， 并 检查 所 有 第 一 个 组 分 为 "的 有 序 对 ， 直 到 从 
其 中 找 出 第 二 个 组 分 为 p 的 有 序 对 为 止 。 然 后 将 该 有 序 对 从 辅助 索引 结构 中 删除 。 


8.5.3 ”习题 


(1) 给 出 如 何 修改 图 8-5 中 的 二 又 查找 树 结构 ， 以 使 “学 号 -姓名 -地 址 -电话 ”关系 可 以 存在 学 生 姓名 
相同 的 多 个 元 组 。 编 写 C 语 言 兄 数 ， 接 受 姓 名 作为 参数 ， 并 列 出 关系 中 “姓名 ”属性 为 该 姓名 的 
所 有 元 组 。 

(2) ** 假设 已 决定 用 “学 号 ”属性 上 的 主 索引 来 存储 “学 号 -姓名 -地 址 -电话 ”关系 ， 还 决定 创建 一 
些 辅助 索引 。 假 设 所 有 的 查找 都 只 会 指定 姓名 、 地 址 或 电话 属性 中 的 某 一 个 。 并 假设 所 有 的 查找 
操作 中 有 75% 是 指定 了 姓名 的 ， 有 20% 是 指定 地 址 的 ， 还 有 5% 是 指定 电话 的 。 还 假设 每 次 插入 或 
删除 操作 的 开销 都 是 1 个 时 间 单 位 ， 再 加 上 我 们 构建 的 每 个 辅助 索引 会 用 掉 1/2 个 时 间 单 位 。 比 方 
说 ， 如 果 我 们 要 构建 所 有 3 个 辅助 索引 的 话 ， 总 的 时 间 开 销 就 是 2.5 个 时 间 单 位 。 设 如 果 指 定 了 有 具 
有 辅助 索引 的 属性 , 那么 一 次 查找 的 开销 是 1 个 时 间 单 位 , 而 如 果 指 定 的 属性 没有 辅助 索引 则 会 花 
费 10 个 时 间 单 位 。 设 a 是 对 指定 了 全 部 3 项 属性 的 元 组 进行 的 插入 和 删除 操作 所 占 的 比例 。 其 余 的 
1-& 是 指定 了 某 一 项 属性 的 操作 所 占 比 例 ， 并 且 符 合 我 们 之 前 对 这 类 查找 操作 出 现 概率 的 假设 。 
比如 ， 所 有 操作 中 有 0.75(1-a) 的 比例 是 给 定 了 “姓名 ” 值 的 查找 。 如 果 目 标 是 让 一 次 操作 的 平 
均 时 间 最 小 化 ， 那 么 当 参 数 a 的 值 分 别 为 (a)0.01; (b)0.1; (c)0.5; (d)0.9; (e)0.99 时 ， 分 别 应 该 创建 
哪些 辅助 索引 ? 

(3) 假设 车 管 所 希望 能 高 效 回应 如 下 类 型 的 查询 ， 也 就 是 说 ， 要 比 查 找 整个 关系 快 得 多 。 

人 给 定 鸭 驶 员 的 姓名 ， 找 到 发 放 给 具有 该 姓名 的 人 们 的 驾驶 证 。 

(ii) 给 定 敬 驶 证 编号 ， 找 到 敬 驶 员 的 姓名 。 

(iii) 给 定 驾 驶 证 编号 ， 找 到 该 驾驶 员 拥 有 的 车 辆 的 注册 号 。 

(vi 给 定 地址 ， 找 到 所 有 登记 为 该 地 址 的 驾驶 员 的 姓名 。 

(Vv) 给 定 注册 号 ( 即 车 牌号 ) ， 找 到 该 车 辆 所 有 者 的 芍 驶 证 。 

为 8.3 节 习题 (2) 中 建立 的 关系 给 出 合适 的 数据 结构 , 从 而 使 得 这 些 查询 能 得 到 高 效 回 应 。 假 设 每 个 
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索引 都 是 从 散 列 表 构 建 的 ， 并 说 出 各 关系 的 主 索引 结构 和 辅助 索引 结构 ， 这 样 就 足够 了 了。 解释 一 
下 这 样 一 来 要 如 何 回应 各 类 型 的 查询 。 

(4)* 假设 需要 高 效 地 从 给 定 的 辅助 索引 中 找到 指向 主 索 引 结 构 中 特定 元 组 的 指针 。 给 出 数据 结构 ， 
让 我 们 能 在 与 找到 的 指针 数 成 正比 的 时 间 内 找到 这 些 指针 。 哪 些 操作 会 因为 这 一 额外 的 数据 结构 
而 变 得 更 加 费时 ? 


8.6 ”关系 间 的 导航 


直到 现在 ， 我 们 只 考虑 了 涉及 单一 关系 的 操作 ， 比 如 在 给 定 元 组 的 一 个 或 多 个 组 分 的 值 的 
情况 下 找到 该 元 组 。 关 系 模型 的 威力 要 得 到 最 好 的 体现 ， 就 需要 考虑 那些 要 求 我 们 “导航 ”, 或 
者 说 从 一 个 关系 跳 转 到 另 一 个 关系 的 操作 。 例 如 ,我 们 在 回应 “学 号 为 12345 的 学 生 CS101 课 程 
的 成 绩 是 多 少 ” 这 样 的 查询 时 ， 所 有 的 处 理 都 是 在 “课程 -学 号 -成 绩 ” 关 系 之 内 展开 的 。 不 过 ， 
如 果 查 询 是 更 为 自然 的 “C.Brown 在 CS101 课 程 中 取得 了 怎样 的 成 绩 ” 呢 ?该 查询 只 在 “课程 - 
学 号 -成 绩 ” 关 系 之 内 就 不 能 得 到 回应 了 ， 因 为 该 关系 使 用 的 是 学 号 ， 而 非 姓名 。 

要 回应 这 一 查询 ， 首 先 必须 查阅 “学 号 -姓名 -地 址 -电话 ”关系 ， 并 将 姓名 C.Brown 转 换 成 
一 个 学 号 ， 或 若干 学 导 ， 因 为 有 可 能 存在 两 个 或 多 个 学 生 姓名 相同 而 学 号 不 同 的 情况 。 然 后 ， 
对 每 个 这 样 的 学 号 ， 都 要 在 “课程 -学 号 -成 绩 ” 关 系 中 查找 对 应 该 学 号 而 且 课程 组 分 为 CS101 
的 元 组 。 可 以 从 每 个 这 样 的 元 组 中 读 取 出 名 为 C.Brown 的 学 生 CS101 课 程 的 成 绩 。 图 8-7 表 示 了 






































该 查询 是 如 何 将 给 定 值 与 这 些 关 系 以 及 所 需 的 回应 联系 在 一 起 的 。 


“COC. Brown” 









“CS101” 





图 8-7 表示 查询 “C.Brown 在 CS101 课 程 中 取得 了 怎样 的 成 绩 ” 的 图 
如 果 没 有 索引 可 用 ， 回 应 该 查询 就 可 能 会 相当 费时 。 假 设 在 “学 号 -姓名 -地 址 -电话 ” 关 





系 中 有 7 个 元 组 ， 而 且 在 “课程 -学 号 -成 绩 ” 关 系 中 有 mm 个 元 组 。 再 假设 名 叫 C.Brown 的 学 生 共 
有 K 个 。 在 假设 没有 索引 可 用 的 情况 下 ， 找 出 这 一 (或 这 些 ) 学 生 在 CS101 课 程 拿 到 的 成 绩 的 算 
法 提纲 就 如 图 8-8 所 示 。 

接着 来 确定 图 8-8 所 示 程 序 的 运行 时 间 。 从 里 层 开始 向 外 分 析 , 第 (6) 行 的 打印 语句 要 花 0() 
的 时 间 。 而 第 (5) 和 第 (6) 行 的 条 件 语句 也 要 花 0() 的 时 间 ， 因 为 第 (5) 行 的 测试 是 0() 时 间 的 测 
试 。 由 于 我 们 假设 在 “课程 -学 号 -成 绩 ” 关 系 中 有 m 个 元 组 ， 这 样 一 来 ， 第 (4) 到 第 (6) 行 的 循环 
要 迭代 mm 次 , 因此 总 共 要 花 O(m) 的 时 间 。 因 为 第 (3) 行 花费 的 是 O(1) 时 间 , 所 以 第 (3) 到 第 (6) 行 的 
程序 块 花 的 时 间 就 是 O(m) 。 

现在 考虑 一 下 第 (2) 到 第 (6) 行 的 if 语 句 。 因 为 第 (2) 行 的 测试 花费 00) 的 时 间 ， 所 以 如 果 条 
件 为 假 则 整个 i£f 语 句 花费 0() 时 间 ， 如 果 为 真 则 花费 O(m) 的 时 间 。 不 过 ， 我 们 已 经 假设 了 该 
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条 件 对 k 个 元 组 为 真 而 对 其 余 元 组 为 假 ， 也 就 是 说 ， 有 k 个 元 组 的 姓名 组 分 是 C.Brown。 因 为 当 
条 件 为 真 与 条 件 为 假 时 所 花 的 时 间 存 在 很 大 的 区 别 ， 所 以 应 该 对 分 析 第 (1) 到 第 (6) 行 的 for 循 环 
的 方式 格外 并 层 小 心 。 也 就 是 说 ， 我 们 不 能 记 下 循环 迭代 的 次 数 并 将 其 屠 上 循环 体 可 能 花费 的 
最 大 时 间 ， 而 是 要 分 开 考虑 第 (2) 行 测试 的 两 种 结果 。 











(1) ” for“ 学 号 -姓名 -地 址 -电话 ”关系 中 的 各 元 组 1 do 

(2) if 1 的 “姓名 ”组 分 为 “C. Brown” begin 

(3) 设 i 是 元 组 1 的 “学 号 ”组 分 ; 

(4) for “课程 -学 号 -成 绩 关 系 ” 中 的 各 元 组 s do 
(5) if s 的 “课程 ”组 分 为 “CS101” 且 


“学 号 ”组 分 为 i then 
(6) print 元 组 s 的 “成 绩 ” 组 分 ; 
end 








图 8-8 ”找到 C.Brown 在 CS101 课 程 取得 的 成 绩 
首先 ， 要 进行 n 次 循环 ， 因 为 这 是 不 同 堆 的 数量 。 对 令 第 (2) 行 的 测试 为 真 的 x 个 元 组 坏 说 ， 
我 们 在 每 个 元 组 上 所 花 时 间 为 O(m) ,或 者 说 总 共 要 花 上 O(km) 的 时 间 。 对 其 余 n-k 个 令 该 测试 
为 假 的 元 组 来 说 ， 每 个 元 组 要 花 0() 的 时 间 ， 或 者 说 总 共 要 花 O(n 一 的 时 间 。 因 为 估计 Kk 是 大 
大 小 于 7 的 ， 所 以 我 们 选择 O(n) 而 非 O(n -月 作为 更 简单 的 紧 上 界 。 因 此 整个 程序 的 时 间 开 销 就 
是 O(n+hm) 。 在 很 可 能 出 现 的 k=1 的 情况 中 ， 当 只 有 一 个 学 生 姓 名 为 C.Brown 时 ， 所 需 的 时 间 
就 是 O(n+m) ， 它 是 与 所 涉及 两 个 关系 的 大 小 之 和 成 正比 的 。 如 果 k 大 于 1， 这 个 时 间 就 会 更 大 。 


8.6.1 利用 索引 为 导航 提速 


有 了 合适 的 索引 ,我 们 在 回应 同样 的 查询 时 平均 只 需要 O(k) 的 时 间 ,， 也 就 是 说 ， 如 果 名 字 
叫 C.Brown 的 学 生 数 为 1， 就 只 需要 0() 的 时 间 。 这 样 是 说 得 通 的 ， 因 为 我 们 肯定 会 检查 2K 个 
元 组 ， 就 是 两 个 关系 各 要 检查 [个 。 如 果 散 列表 使 用 了 数量 恰当 的 散 列 表 元 ,这 些 索引 让 我 们 能 
以 平均 每 个 元 组 O0) 时 间 的 开销 找到 所 需 的 元 组 。 如 果 拥 有 对 应 “学 号 -姓名 -地 址 -电话 ” 关 
系 的 “姓名 ”索引 ， 以 及 对 应 “课程 -学 号 -成 绩 ” 关 系 的 “课程 -学 号 ”有 序 对 上 的 索引 ， 那 
么 找 出 C.Brown 在 CS101 课 程 中 取得 的 成 绩 的 算法 可 以 大 致 描述 为 图 8-9 所 示 的 样子 。 








(1) 使 用 “姓名 ”上 的 索引 ， 找 到 “学 号 -姓名 -地 址 -成 绩 ” 关 系 中 
“姓名 ”组 分 为 “C. Brown” 的 各 元 组 ; 
for 步骤 (D) 中 找到 的 各 元 组 t do begin 
设 i 是 元 组 t 的 “学 号 ”组 分 ; 


使 用 “课程 -学 号 -成 绩 ” 关 系 中 “课程 ”和 “学 号 ”上 的 索引 ， 
找到 “课程 ”组 分 为 “CS101” 而 且 “ 学 号 ”组 分 为 1 的 元 组 s ; 
print 元 组 Ss 的“ 成绩” 组 分 ， 
end 





图 8-9 ”使 用 索引 找到 C.Brown 在 CS101 课 程 中 取得 的 成 绩 


我 们 假设 “姓名 ”索引 是 具有 约 n 个 散 列 表 元 的 散 列 表 ， 是 用 作 辅 助 索 引 的 。 因 为 n 是 “学 
号 -姓名 -地 址 -成 绩 ” 关 系 中 的 元 组 数量 ， 所 以 每 个 散 列 表 元 中 平均 有 0() 个 元 组 。 如 果 具 有 
该 姓名 的 元 组 有 k 个 ， 在 散 列 表 元 中 找到 这 些 元 组 就 要 花费 O(R) 的 时 间 ， 而 且 跳 过 该 散 列 表 元 
中 可 能 存在 的 其 他 元 组 要 花 O0) 的 时 间 。 因 此 ， 图 8-9 的 第 (1) 行 平均 要 花 O(K) 的 时 间 。 





8.6 关系 间 的 导航 343 





第 (2) 到 第 (5) 行 的 循环 要 执行 次 。 假 设 把 在 第 (1) 行 找到 的 个 元 组 存储 在 一 个 链表 中 ， 那 
么 不 管 是 找到 下 一 个 元 组 #， 还 是 发 现 没 有 更 多 的 元 组 ,进行 循环 所 花 的 时 间 都 为 0U) ， 而 且 第 
(3) 到 第 (5) 行 的 开销 也 是 一 样 的 。 我 们 声明 第 (4) 行 也 能 在 0Q) 时 间 内 执行 ， 因 此 第 (2) 到 第 (5) 行 
的 运行 时 间 也 是 O(k) 。 

下 面 来 分 析 一 下 第 (4) 行 。 第 (4) 行 要 求 在 给 定 某 一 元 组 的 键 值 的 情况 下 对 其 进行 查找 。 假设 
“课程 -学 号 -成 绩 ” 关 系 具 有 其 键 {课程 ,学 号 } 上 的 主 索引 ， 而 且 该 索引 是 约 有 m 个 散 列 表 元 的 
散 列 表 。 那么 , 每 个 散 列 表 元 中 所 含 元 组 的 平均 数 就 是 OU)，, 因此 图 8-9 的 第 (4) 行 所 花 的 时 间 就 
是 0(Q) 。 这 样 我 们 就 能 得 出 第 (2) 到 第 (5) 行 的 循环 体 平均 会 花费 00) 的 时 间 ， 因 此 图 8-9 所 示 的 
整个 程序 就 平均 会 花费 O(k) 的 时 间 。 也 就 是 说 ,这 一 时 间 开 销 是 与 具有 我 们 要 查询 的 姓名 的 学 
生 的 数量 成 比例 的 ， 而 不 用 考虑 涉及 的 关系 的 大 小 。 


8.6.2 ”多 关系 上 的 导航 


有 些 导航 技巧 让 我 们 可 以 高 效 地 从 一 个 关系 跳 转 到 男 一 个 关系 ， 这 些 技 巧 也 可 以 用 于 涉及 
多 个 关系 的 导航 。 例 如 ， 假 设想 知道 “C.Brown 星 期 一 上 午 9 点 在 哪里 ? ”假设 他 在 上 课 ，, 我 们 
就 可 以 通过 如 下 方式 回应 该 查询 ， 找 到 C.Brown 选 修 的 课程 ， 看 看 其 中 是 否 有 课 是 在 星期 一 上 
午 9 点 上 ， 如 果 有 的 话 ， 找 到 该 课程 上 课 的 教室 就 行 了 。 图 8-10 展 示 了 从 给 定 值 C.Brown 到 得 出 
的 回应 期 间 在 各 关系 间 的 导航 。 


























学 号 姓名 地 址 电话 





图 8-10 ”表示 “C.Brown 星 期 一 上 午 9 点 在 哪里 ”这 一 查询 的 图 


以 下 方案 假设 只 有 一 个 名 为 C.Brown 的 学 生 ， 如 果 有 多 个 名 叫 C.Brown 的 学 生 ， 就 可 以 得 到 
星期 一 早上 9 点 他 们 中 的 一 个 或 多 个 人 所 在 的 教室 。 这 里 还 假设 这 名 学 生 没有 选修 相互 冲突 的 课 
程 ， 也 就 是 说 ， 他 在 星期 一 早上 9 点 最 多 只 上 一 门 课 。 

(1) 利用 对 应 C.Brown 的 “学 号 -姓名 -地 址 -电话 ”关系 ， 找 到 C.Brown 的 学 号 ， 设 他 的 学 号 
为 i。 











(2) 在“ 诬 程 -学 号 -成 绩 ” 关 系 中 查找 所 有 学 号 组 分 为 的 元 组 ,， 设 {c1，…，c} 是 这 些 元 组 
中 “课程 ” 值 的 集合 。 
(3) 在 “课程 -日 子 - 时 刻 ” 关 系 中 ,查找 “ 课 程 ”组 分 为 c(〈 即 第 (2) 步 中 找到 的 讲 程 之 一 ) 
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的 元 组 。 应 该 最 多 只 有 一 个 元 组 的 “日 子 ” 组 分 为 “M” 而 且 “ 时 刻 ” 组 分 为 “9AM”。 

(4) 如 果 第 (3) 步 中 找到 的 是 课程 c， 那 么 在 “课程 -教室 ”关系 中 查找 c 上 课 的 教室 。 假 设 
C.Brown 没 打算 旷 诬 ， 这 就 是 他 星期 一 上 午 9 点 所 在 的 位 置 。 

如 果 没 有 索引 , 那么 我 们 可 以 期 待 的 最 佳 情况 就 是 , 在 与 涉及 的 4 个 关系 的 大 小 之 和 成 比例 
的 时 间 内 完成 这 一 方案 。 不 过 ， 有 知 干 个 索引 可 供 我 们 利用 。 

(a) 在 第 (D) 步 中 ， 可 以 使 用 “学 号 -姓名 -地 址 -电话 ”关系 中 的 “姓名 ”组 分 作为 索引 ， 从 

而 在 平均 为 O0) 的 时 间 内 得 到 C.Brown 的 学 号 。 
(b) 在 第 (2) 步 中 , 假设 C.Brown 选 修了 夺 ] 课 程 , 可 以 利用 “课程 -学 号 -成 绩 ” 关系 中 的 “学 
号 ”组 分 上 的 索引 ， 在 O(6) 的 时 间 内 得 到 C.Brown 选 修 的 所 有 膏 程 。 

(c) 在 第 (3) 步 中 ， 可 以 利用 “课程 -日 子 -时 刻 ” 关 系 中 “课程 ”组 分 上 的 索引 ， 这 样 一 
来 ， 就 可 以 在 与 第 (2) 步 得 到 的 K 门 课程 每 周 上 课 次 数 之 和 成 比例 的 时 间 内 ， 找 出 这 些 
课程 全 部 的 上 课时 间 。 如 果 假 设 每 门 课程 每 周 上 课 次 数 不 超过 5 次 ， 那 么 最 多 只 有 5SK 
个 元 组 , 因此 可 以 在 O(6) 的 平均 时 间 内 找到 它们 。 如 果 没 有 该 关系 “课程 ”属性 上 的 
索引 ， 而 是 有 “日 子 ” 和 (或 ) “时刻” 属性 上 的 索引 , 虽然 可 能 要 查看 远 多 于 O(K) 数 
量 的 元 组 ( 取决 于 星期 一 要 上 多 少 课 , 或 是 某 一 天 的 9 点 要 上 多 少 课 ), 但 还 是 能 从 这 
种 索引 中 受益 。 

在 第 (4) 步 中 ， 可 以 利用 “课程 -教室 ”关系 中 “课程 ”属性 上 的 索引 。 在 这 种 情况 下 ， 
可 以 在 平均 为 O0) 的 时 间 内 检索 到 所 要 找 的 教室 。 

这 样 就 可 以 得 出 这 样 的 结论 ， 有 了 所 有 这 些 合适 的 索引 , 可 以 在 O(6) 的 平均 时 间 内 回复 这 
些 非常 复杂 的 查询 。 因 为 可 以 假设 C.Brown 所 选课 程 的 数量 Kf 很 小 ， 比 方 说 5 门 左 右 , 那么 这 一 时 
间 通 常会 特别 少 ， 而 且 特别 要 指出 的 是 ， 该 时 间 与 所 涉及 关系 的 大 小 都 无 关 。 











(d 


—_— 








总 结 : 关系 的 快速 访问 


回顾 一 下 我 们 从 渐 趋 复杂 的 关系 中 获得 答案 的 方式 是 很 实用 的 。 首 先是 在 7.8 节 使 用 散 列 
表 或 诸如 二 又 查找 树 或 (概括 化 的 ) 特征 向 量 这 样 的 结构 实现 函数 ， 按 照 本 章 中 的 内 容 来 看 就 
是 定义 域 为 键 的 二 元 关系 。 然 后 ， 在 7.9 节 中 看 到 ， 只 要 关系 是 二 元 的 ， 这 些 概念 也 适用 于 定 
义 域 不 为 键 的 情况 。 

在 8.4 节 中 看 到 ， 并 不 需要 要 求 关 系 是 二 元 的 ， 可 以 将 属于 键 的 一 部 分 的 全 部 属性 作为 一 
个 “定义 域 ”集合 ， 而 将 所 有 其 他 属性 作为 一 个 “ 值 域 ”集合 。 此 外 ， 我们 在 8.4 节 中 还 看 到 
定义 域 不 一 定 要 是 键 。 

在 8.5 节 中 我 们 了 解 到 ， 可 以 使 用 某 关 系 上 的 多 个 索引 结构 ， 提 供 基于 不 属于 定义 域 的 必 
性 的 快速 访问 。 而 且 在 8.6 节 中 我 们 看 到 ， 可 以 结合 多 个 关系 上 的 索引 ， 在 与 实际 查阅 的 元 组 
数 成 比例 的 时 间 内 执行 复杂 的 信息 检索 。 





8.6.3 ”习题 
(1) 假设 图 8-9 中 的 “课程 -学 号 -成 绩 ” 关 系 不 具备 “ 诬 程 -学 号 ”对 上 的 索引 ， 而 是 只 有 课程 这 一 个 
属性 上 的 索引 。 这 会 对 图 8-9 所 示 程 序 的 运行 时 间 造 成 怎样 的 影响 ”如 果 索 引 只 建立 在 “学 号 ” 属 

性 上 呢 ? 
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CO) 讨论 一 下 如 何 高 效 地 回应 下 列 查询 。 在 每 种 情况 下 都 要 陈述 对 中 间 和 集合 的 元 素数 量 ( 比如 ， 
C.Brown 所 选课 程 的 数量 ) 作出 的 假设 ,还 要 讲 出 都 假设 有 哪些 索引 存在 。 
(a) 找到 C.Brown 所 选课 程 的 所 有 前 提 。 
(b) 找到 会 在 Turing Aud. 上 课 的 所 有 学 生 的 电话 号 码 。 
(c) 找到 CS206 课 程 的 前 提 课 程 的 前 提 。 

(3) 假设 没有 索引 ， 那么 习题 (3) 中 的 各 查询 要 论 多 少时 间 ， 将 其 表示 为 所 涉及 关系 的 大 小 的 函数 ， 其 
中 要 对 所 有 元 组 进行 迭代 ， 就 像 本 节 的 那些 示例 中 一 样 。 


8.7 关系 代数 


我 们 在 8.6 节 中 看 到 , 涉及 多 个 关系 的 查询 可 能 是 相当 复杂 的 。 用 一 种 比 C 语 言 “ 高 级 得 多 ” 
的 语言 来 表示 这 样 的 查询 是 很 实用 的 ， 和 C 语 言 不 同 的 是 ， 这 种 语言 中 的 查询 在 表示 我 们 想 要 
的 内 容 时 ， 比 如 , “课程 ”组 分 等 于 CS101 的 所 有 元 组 ， 可 以 不 需要 人 处理 诸如 在 索引 中 进行 查找 
操作 这 样 的 问题 。 出 于 这 种 目的 ， 一 种 名 为 关系 代数 的 语言 应 运 而 生 。 

就 像 任何 代数 那样 ， 关 系 代数 让 我 们 可 以 应 用 代数 法 则 改写 查询 。 因 为 复杂 的 查询 通常 有 
很 多 不 同 的 步骤 序列 ， 我 们 要 借助 这 些 步骤 从 存储 的 数据 中 得 到 查询 的 回应 ， 而 且 因为 不 同 的 
步 又 序列 是 由 不 同 的 代数 表达 式 表示 的 ， 所 以 关系 代数 提供 了 一 个 将 代数 作为 设计 理论 的 绝 佳 
例子 。 其 实 ， 这 种 借助 关系 代数 表达 式 的 变形 实现 的 效率 提升 ， 可 视 作 代数 的 力量 在 计算 机 科 
学 中 得 到 体现 的 最 突出 示例 。 代 数 变形 带 来 的 “优化 ”查询 的 能 力 是 8.9 节 的 主题 。 


8.7.1 关系 代数 的 操作 数 


在 关系 代数 中 ， 操 作 数 都 是 关系 。 与 其 他 代数 一 样 ， 这 里 的 操作 数 既 可 以 是 常量 一 一 在 这 
种 情况 下 就 是 指定 的 关系 ， 也 可 以 是 表示 未 知 关系 的 变量 。 不 过 ， 不 管 是 变量 还 是 常量 ,每 个 
操作 数 都 有 特定 的 模式 〈 为 关系 中 的 列 命名 的 属性 的 集合 )。 因 此 , 常量 参数 可 能 是 像 下 面 这 样 
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该 关系 的 模式 是 {4，B，C}， 它 含有 3 个 元 组 ，(0，1，2)、(0，3，4) 和 (5，2，3)。 

变量 参数 可 以 用 R(4, BC) 表示 ， 它 表示 被 称 为 R 的 关系 ,该 关系 的 各 列 分 别名 为 4、B 和 C， 
但 其 组 分 集合 是 未 知 的 。 如 果 关 系 R 的 模式 {4,B,C} 是 可 以 理解 或 是 无 关 紧 要 的 , 就 可 以 将 R 当 作 
操作 数 。 
8.7.2 关系 代数 的 集合 运算 符 

首先 要 使 用 的 3 种 运算 符 是 常见 的 集合 元 算 : 并 、 交 、 差 ,我 们 在 7.3 节 中 讨论 过 这 些 运算 。 
这 里 要 对 这 些 运 算 符 的 操作 数 提出 一 个 要 求 : 两 个 操作 数 的 模式 一 定 要 相同 。 这 样 一 来 ， 结 
的 模式 就 自然 是 这 两 个 参数 的 模式 。 
+ 示例 8.11 

设 R 和 S$ 分 别 是 图 8-11a 和 图 8-11b 中 的 关系 。 请 注意 ， 这 两 个 关系 的 模式 都 是 {4,B}。 并 集运 
算 符 会 生成 这 样 一 个 关系 ， 其 中 各 元 组 要 么 在 R 中 ， 要 么 在 S 中 ,或 者 是 在 两 者 之 中 。 请 注意 ， 
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因为 关系 是 集合 ， 所 以 即便 某 元 组 可 能 同时 出 现在 R 和 S$ 中 ， 该 元 组 在 得 到 的 关系 中 也 最 多 只 能 
出 现 一 次 ， 就 像 本 例 中 的 元 组 (0,1) 这 样 。 关 系 UUS 如 图 8-11c 所 示 。 

交集 运算 符 会 生成 由 同时 出 现在 两 个 操作 数 中 的 元 组 构成 的 关系 。 因 此 ， 关 系 RMS 只 含 
有 元 组 (0,1)， 如 图 8-11d 所 示 。 差 集运 算 生成 的 关系 包含 那些 在 第 一 个 关系 中 而 不 在 第 二 个 关系 
中 的 元 组 。 关 系 R-S 如 图 8-11e 所 示 ， 具 有 R 中 的 元 组 (2,3)， 因 为 该 元 组 不 在 S 中 ， 而 它 不 含 R 
中 的 元 组 (0,1)， 因 为 这 一 元 组 也 在 S 中 。 




















4 B A B 
0 1 0 1 
和 3 4 5 
(a) 下 (b) 5 
A B 
0 1 
2 3 A B A B 
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(c) RUS (d) RNMNS (e) R—S 


图 8-11 关系 代数 运算 的 示例 


\ 一 Apr rr 


8.7.3 选择 运算 符 


关系 代数 中 的 其 他 运算 符 是 用 来 执行 本 草 中 研究 的 这 些 操作 的 。 例 如 ， 我 们 经 常 想 从 关系 
中 提取 出 满足 某 些 条 件 的 元 组 ， 比 如 从 “ 诬 程 - 学 号 -成 绩 ” 关 系 中 提取 出 “ 访 程 ”组 分 为 CS101 
的 所 有 元 组 。 为 达成 这 一 目的 ， 要 使 用 选择 运算 符 。 该 运算 符 接 受 一 个 关系 作为 操作 数 ， 但 还 
要 接受 一 个 条 件 表达 式 作为 “参数 "。 我 们 把 选择 运算 符 写 为 cc(R) ,其 中 o (小 写 的 希腊 字母 
西格玛 ) 是 表示 选择 的 符号 ，C 是 条 件 ， 而 R 是 关系 操作 数 。 条 件 C 可 以 用 关系 R 的 模式 中 的 属 
性 以 及 常数 作为 操作 数 。 条件 C 可 以 使 用 的 运算 符 就 是 常用 于 C 语 言 条 件 表达 式 中 的 那些 ,也 就 
是 算术 比较 符 和 逻辑 连接 符 。 

这 一 运算 的 结果 是 模式 与 R 的 模式 相同 的 关系 。 我 们 要 把 在 将 条 件 C 中 的 属性 4 蔡 换 为 元 组 1 
对 应 列 4 的 组 分 时 使 得 条 件 C 为 真 的 每 个 元 组 1 都 放 入 该 关系 中 。 


+ 示例 8.12 
设 CSG 表 示 图 8-1 中 的 “课程 -学 号 -成 绩 ” 关 系 。 如 果 想 要 那些 课程 组 分 为 “CS101” 的 元 
组 ， 就 可 以 写 出 如 下 表达 式 






































人 课程 -“CSl0b(C9OD) 
这 一 表达 式 的 结果 是 模式 与 CSGC 相 同 ， 也 就 是 具有 { 课 程 ， 学 号 ， 成 绩 } 模 式 的 关系 ， 而 且 元 组 
的 集合 就 如 图 8-12 所 示 。 也 就 是 说 ， 只 有 这 些 “ 课 程 ”组 分 为 CS101 的 元 组 才能 使 条 件 为 真 。 这 
样 一 来 ， 当 我 们 用 CS101 蔡 换 了 “课程 ”， 条 件 就 成 了 CS101 = CS101。 如 果 该 元 组 的 “课程 ” 
组 分 有 其 他 的 值 ， 比 如 EE200， 就 得 到 EE200 = CS101 这 样 的 不 成 立 的 表达 式 。 
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CS101 12345 


CS101 67890 
CS101 33333 





图 8-12 表达 式 OO 课程 Csi0"(CSG) 的 结 


8.7.4 投影 运算 符 

选择 运算 符 会 生成 某 关 系 删除 若干 行 之 后 的 副本 ， 而 我 们 经 常 想 要 生成 关系 删除 若干 列 之 
后 的 副本 。 为 达到 这 一 目的 ， 我 们 还 有 用 符号 7 表示 的 投影 运算 符 。 和 选择 一 样 ， 投 影 运算 符 
也 是 接受 一 个 关系 作为 参数 ， 它 还 要 接受 另 一 个 参数 ， 就 是 从 作为 参数 的 关系 的 模式 中 选取 的 
属性 列表 。 

如 果 R 是 具有 属性 集合 {41,…, 4 的 关系 ， 而 (B1,…,B,) 是 某 些 4 组 成 的 列表 ， 那 么 
Ns, .… 5 (R) ， 关 系 R 到 属性 BI,…, B, 上 的 投影 是 按照 以 下 方式 形成 的 元 组 集合 。 取 R 中 的 元 组 
t， 提 取 其 属性 B1,…, B, 中 的 组 分 ， 假设 这 些 组 分 分 别 是 51,…, b;， 然 后 将 元 组 (51, …, b;) 添 加 到 
关系 zs。,.. s(R) 中 。 请 注意 ，R 中 可 能 有 不 止 一 个 元 组 在 B1, …, B, 中 的 组 分 都 相同 。 如 果 这 样 
的 话 ， 这 些 元 组 的 投影 只 有 一 个 副本 会 进入 xs, .. s(R) ， 因 为 该 关系 和 所 有 关系 一 样 ， 不 可 能 
含有 某 一 元 组 的 多 个 副本 。 
+ 示例 8.13 

假设 只 想 看 到 选修 CS101 课 程 的 学 生 的 学 号 。 可 以 应 用 与 示例 8.12 相 同 的 选择 运算 , 这 样 就 
给 出 了 CSG 关 系 中 所 有 对 应 CS101 的 元 组 ， 不 过 之 后 还 必须 将 课程 和 成 绩 投影 掉 ， 也 就 是 只 投 
影 到 “学 号 ”上 。 执行 这 两 项 运算 的 表达 式 为 

Tp (Oa co CSO)) 

该 表达 式 的 结果 是 图 8-12 的 关系 投影 到 其 “学 号 ”组 分 上 ， 也 就 是 如 图 8-13 所 示 的 一 元 关系 。 











图 8-13 ”选修 CS101 的 学 生 


8.7.5 ”关系 的 联接 


最 后 ， 我 们 需要 一 种 方式 ， 用 来 表示 两 个 关系 被 关联 起 来 从 而 可 以 从 一 个 关系 向 男 一 个 关 
系 导航 的 概念 。 为 了 达成 这 一 目的 ， 要 使 用 表示 为 的 联接 运算 符 。" 假 设 有 两 个 关系 R 和 S， 
其 属性 集合 (模式 ) 分 别 为 {41,…, 4w} 和 {B1,…, Bm}。 我 们 从 两 个 集合 中 各 选 出 一 个 属性 ， 比 
方 说 是 4 和 有 瓦 ， 而 这 些 属性 将 成 为 以 R 和 4 为 参数 的 联接 运算 的 参数 。 


J 我 们 这 里 描述 的 “联接 ”不 如 关系 代数 中 常见 的 联接 运算 更 一 般 化 ， 但 它 可 以 用 来 让 我 们 从 这 一 运算 符 受 益 ， 
而 不 用 深入 到 该 主题 的 所 有 复杂 性 中 。 
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要 形成 R 和 8 的 写作 Rezs S 的 这 种 联接 ,就 要 从 R 中 取出 各 元 组 x， 并 从 5 中 取出 各 元 组 s 加 以 
比较 。 如 果 元 组 x 对 应 4 的 组 分 等 于 元 组 s 对 应 B 的 组 分 ， 就 从 r 和 s 形 成 一 个 元 组 ， 否 则 ， 就 不 会 
从 r 和 s 的 配对 中 创建 元 组 。 要 从 r 和 s 形 成 元 组 ， 就 要 取 r 中 的 组 分 后面 加 上 s 中 的 所 有 组 分 , 但 
要 去 掉 对 应 B 的 组 分 ， 因 为 它 和 7 中 对 应 4 的 组 分 是 相同 的 。 

关系 Rizs S 就 是 上 述 方式 所 形成 的 元 组 构成 的 集合 。 请 注意 ， 奉 R 的 4 列 和 5 的 及 列 都 没有 
值 出 现 , 则 这 一 关系 也 可 能 不 含 任何 元 组 。 在 男 一 种 极端 情况 下 ，R 中 每 个 元 组 4 组 分 的 值 都 相 
同 ， 而 该 值 也 出 现在 S$ 中 每 个 元 组 的 B 组 分 里 。 那 么 ,联接 得 到 的 关系 中 元 组 的 数量 就 等 于 R 中 
元 组 数量 乘 以 S 中 元 组 数量 的 积 ， 因 为 元 组 的 每 个 有 序 对 都 能 匹配 。 一 般 而 言 ， 真相 就 藏 在 这 些 
极端 情况 之 间 的 某 个 地 方 ，R 中 的 各 元 组 与 5 中 的 一 些 ( 而 非 全 部 ) 元 组 配对 。 

联接 得 到 的 关系 的 模式 是 {41,…, 4 B1,…, Bii, Bjri,…, Bm} ， 也 就 是 R 和 5S 中 除 Bj 之 外 的 全 
部 属性 构成 的 集合 。 不 过 , 还 是 可 能 有 属性 重 名 的 情况 出 现 , 如 果 说 是 4 中 的 某 一 属性 与 3 中 ( 除 
Bj 之 外 ， 不 是 要 联接 的 属性 ) 的 茶 一 属性 相同 。 如 果 出 现 这 种 情况 ， 这 一 对 相同 的 属性 中 就 必 
须 有 一 个 要 重 命名 。 


+ 示例 8.14 

假设 我 们 要 对 “课程 日子- 时刻 ”关系 (简称 CDH) 和 “课程 -教室 ”关系 ( 简称 CR ) 进 
行 连接 。 例 如 ， 我 们 可 能 想 知 道 每 间 教 室 都 有 哪些 时 间 是 在 上 课 的 。 要 回应 这 一 查询 ， 就 必须 
将 来 自 CR 的 各 元 组 与 来 CDH 的 各 元 组 配对 , 要求 配对 的 两 个 元 组 的 课程 组 分 是 相同 的 , 也 就 是 
说 ， 这 两 个 元 组 说 的 是 相同 的 课程 。 因 此 ， 如 果 在 要 求 二 者 的 “课程 ”属性 相等 的 情况 下 联接 
CR 和 CDH， 就 会 得 到 具有 {课程 ， 教 室 ， 日 子 ， 时 刻 } 模 式 的 关系 ， 它 所 含 的 元 组 (c,， r+,，d，, 只) 
满足 (c，7) 是 CR 的 元 组 且 (c，d， 罗 是 CDH 的 元 组 这 两 个 条 件 。 定 义 该 关系 的 表达 式 为 

CR x» CDH 
课程 = 课程 


假设 CR 和 CD 关系 含有 图 8-2 中 的 那些 元 组 ， 那 么 该 表达 式 产生 的 关系 的 值 就 如 图 8-14 所 示 。 




















Turing Aud. 
Turing Aud. 


Turing Aud. 


25 Ohm Hall 
25 Ohm Hall 
25 Ohm Hall 





图 8-14 课程 = 课程 上 CR 和 CDH 的 联接 


要 知道 图 8-14 中 的 关系 是 如 何 构 建 的 ， 就 要 考虑 一 下 CR 的 第 一 个 元 组 ，(CS101，Turing 
Aud.)。 我们 要 检查 CDH 中 那些 “课程 ” 值 也 是 CS101 的 元 组 。 在 图 8-2c 中 ,可 以 看 到 前 3 个 元 组 
都 是 能 匹配 的 ， 而 且 我 们 可 以 由 这 些 元 组 构建 图 8-14 的 前 3 个 元 组 。 例 如 ，CDZ 的 第 一 个 元 组 
(CS101，M，9AM ) 与 元 组 (CS101，Turing Aud. ) 联接 ， 就 得 到 了 图 8-14 的 第 一 个 元 组 。 要 
注意 该 元 组 是 如 何 与 构成 它 的 两 个 元 组 各 自 对 应 的 。 

同样 ，CR 的 第 二 个 元 组 ( EE200, 25 Ohm Hall ) 与 CDH 的 后 3 个 元 组 有 着 相同 的 “课程 ”组 分 。 
这 3 个 配对 就 构成 了 图 8-14 中 的 后 3 个 元 组 。 而 CR 的 最 后 一 个 元 组 (PH100, Newton Lab. ) 的 “课程 ” 
组 分 与 CDH 任 一 元 组 的 “课程 ”组 分 都 不 同 。 因 此 ， 该 元 组 没有 对 这 一 联接 作出 任何 贡献 。 
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8.7.6 自然 联接 


当 我 们 联接 两 个 关系 R 和 Ss 时 ， 常 会 遇 到 要 等 同 的 属性 同名 的 情况 。 如 果 此 外 还 有 R 和 5 没有 
其 他 属性 同名 , 那么 就 可 以 将 联接 的 参数 省 略 , 将 其 简写 为 ReaS。 这 样 的 联接 就 叫 作 自然 联接 。 

例如 ， 示 例 8.14 中 的 联接 就 是 自然 联接 。 要 等 同 的 属性 都 叫 “ 诬 程 ”， 而 CR 和 CDH 中 其 他 
属性 的 名 称 部 是 不 同 的 。 因 此 我 们 可 以 将 该 联接 简写 为 CR CDH。 


8.7.7 关系 代数 表达 式 的 表达 式 树 

就 像 为 算术 表达 式 绘制 表达 式 树 那样 ， 可 以 将 关系 代数 表达 式 表示 为 树 。 叶 子 都 是 用 操作 
数 标记 , 也 就 是 用 特定 的 关系 或 是 表示 关系 的 变量 来 标记 。 每 个 内 部 节点 都 是 由 运算 符 标 记 的 ， 
如 果 是 选择 、 投 影 或 联接 〈 除了 不 需要 参数 的 自然 联接 ) 运算 符 ， 还 要 包括 运算 符 的 参数 。 各 
内 部 节点 X 的 子 节 点 都 是 表示 应 用 了 布点 N 处 的 运算 符 的 操作 数 。 

















元 日 子 ， 时 刻 





CR. CDH 
图 8-15 ”关系 代数 中 的 表达 式 树 


+ 示例 8.15 

接着 示例 8.14 的 情况 ， 假 设 我 们 想 知 道 的 不 是 整个 CRea CDH 关系， 而 只 是 想 知 道 在 Turing 
Aud. 有 课 的 “日 子 - 时 刻 ” 对 。 然 后 我 们 需要 取 图 8-14 中 的 关系 ， 并 进行 下 列 操作 。 

(1) 选择 那些 “教室 ”组 分 为 “Turing Aud.” 的 元 组 ; 

(2) 将 这 些 元 组 映射 到 日 子 和 时 刻 属性 上 。 

按 上 述 次 序 执行 这 一 系列 联接 、 选 择 和 投影 的 表达 式 为 

THF, a (Os tonne sve (CR DACDH) ) 

我 们 可 以 将 这 一 表达 式 表 示 成 如 图 8-15 所 示 的 树 。 在 表示 联接 的 节点 处 计算 出 的 关系 就 是 图 
8-14 所 示 的 关系 。 而 选择 节点 处 的 关系 是 图 8-14 中 的 前 3 个 元 组 ， 因 为 它们 的 “教室 ”组 分 中 都 
有 Turing Aud.。 该 表达 式 树 根 节点 对 应 的 关系 如 图 8-16 所 示 ， 也 就 是 这 3 个 元 组 的 日 子 和 时 刻 
组 分 。 











图 8-16 ”图 8-15 中 表达 式 的 结 
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SQL， 基 于 关系 代数 的 语言 


很 多 现代 数据 库 系 统 都 使 用 一 种 名 为 SQL ( Structured Query Language， 结 构 化 查询 语言 
的 语言 表示 查询 。 尽管 对 该 语言 的 详细 介绍 超出 了 本 书 范围 , 不 过 我 们 在 这 里 可 以 用 几 个 例子 
来 给 读者 一 点 关于 SQL 的 印象 。 


SELECT Studentld 
FROM CSG 
WHERE Course = "CS101" 


就 是 用 SQL 的 方式 表示 示例 8.13 的 查询 ， 也 就 是 
TT (c 教室 =“CS101” (CSG)) 

其 中 FROM 子 句 表示 该 查询 的 对 象 关系 ,而 WHERE 子 句 给 出 了 选择 的 条 件 ，SELECT 子 句 则 给 出 
了 答案 投影 到 的 那些 属性 。 很 不 幸 的 是 ，SQL 中 的 关键 词 SELECT 并 非 对 应 关系 代数 中 的 选择 
运算 符 ， 而 是 对 应 投影 运算 符 。 

举 个 更 复杂 的 例子 ， 可 以 将 示例 8.15 中 查询 KHz, na( ass -nmsAuds(CR [qd CDH) 表示 为 如 
下 SQL 程 序 。 

SELECT Day, Hour 


FROM CR, CDH 
WHERE CR.Course = CDH.Course AND Room = "Turing Aud." 


这 里 的 FROM 子 负 告诉 我 们 要 联接 CR 和 CD 万 这 两 个 关系 。WHERE 子 名 的 第 一 部 分 是 联接 的 条 
件 ， 它 表示 CR 的 课程 属性 必须 和 CD 万 的 课程 属性 相等 ， WHERE 子 名 的 第 二 部 分 则 是 选择 的 条 
件 ; 而 SELECT 子 句 则 告诉 我 们 映射 中 的 那些 属性 。 





8.7.8 习题 

(1) 用 关系 代数 表示 8.4 市 习题 (2) 中 (a)(b)(c) 小 题 的 查询 ， 假 设 我 们 想 要 的 答案 是 完整 的 元 组 。 

(2) 重复 习题 (1) 的 练习 ， 假 设想 要 的 只 有 那些 规范 中 带 * 的 组 分 。 

(3) 用 关系 代数 表示 8.6 节 习题 (2) 中 (a)(b)(c) 小 题 的 查询 。 请 注意 (c) 小 题 ， 在 将 关系 与 其 自身 联接 时 必 
须要 重 命名 一 些 属性 。 

(4) 用 关系 代数 表示 “C.Brown 星 期 一 上 午 9 点 在 哪里 ”这 一 查询 。8.6 节 最 后 的 讨论 应 该 能 指示 出 回应 
该 查询 所 必需 的 联接 。 

(5) 画 出 习题 (2) 中 (g) 至 (co) 的 情况 、 习 题 (3) 中 (a) 至 (@O) 的 情况 以 及 习题 (4) 中 的 查询 所 对 应 的 表达 式 树 。 


8.8 ”关系 代数 运算 的 实现 

为 关系 代数 运算 使 用 得 当 的 数据 结构 和 算法 可 以 加 快 数据 库 查询 的 速度 。 在 本 节 中 ， 我 们 
将 考虑 一 些 相对 简单 常见 的 关系 代数 运算 的 实现 策略 。 
8.8.1 并 交差 的 实现 


这 3 种 基本 集合 运算 的 实现 方式 与 在 关系 和 集合 中 的 实现 方式 相同 。 可 以 按照 7.4 节 讨论 过 
的 ， 通 过 为 两 个 集合 排序 与 合并 取 两 个 集合 或 关系 的 并 集 。 而 交集 和 差 集 则 可 利用 相似 的 技巧 
求 得 。 如 果 参 加 运算 的 两 个 关系 各 含 n 个 元 组 ， 就 要 花 O(nlogn) 的 时 间 为 其 排序 并 用 O(n) 的 时 
间 合 并 ， 或 者 说 总 共 需 要 O(nlogn) 的 时 间 。 
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不 过 ， 为 关系 R 和 Ss 求 并 集 的 方式 还 有 很 多 ， 而 且 有 些 方式 还 更 高 效 。 首 先 ， 我 们 可 能 不 去 
考虑 为 同时 出 现在 R 和 5 中 的 元 组 消除 重复 副本 的 事 。 就 是 生成 R 的 副本 ， 比 如 说 ， 放 进 链表 中 ， 
然后 将 S 的 所 有 元 组 也 添加 进 该 链表 ， 而 不 去 检查 5S 中 的 元 组 是 否 也 出 现在 RK 中。 这 一 操作 可 以 
在 与 R 和 5$ 的 大 小 之 和 成 比例 的 时 间 内 完成 。 而 这 样 做 的 缺点 在 于 ， 严 格 地 讲 ， 得 到 的 结果 并 不 
是 R 和 S 的 并 集 ， 因 为 其 中 可 能 存在 重复 的 元 组 。 不 过 ， 也 许 这 些 重复 的 存在 并 无 大 碍 ， 因 为 可 
预期 它们 很 少 出 现 。 或 者 ,我们 可 能 发 现在 后 续 的 阶段 中 消除 这 些 重 复 会 更 方便 ， 比 如 在 取 更 
多 关系 的 并 集 后 进行 排序 ， 然 后 再 消除 重复 。 

另 一 种 选择 是 使 用 索引 。 例 如 ,假设 R 具 有 属性 A 上 的 索引 ， 而 该 属性 是 S$ 的 键 。 那 么 
如 果 要 取 二 者 的 并 集 RUS， 首 先 从 5 的 元 组 开始 ， 并 依次 检查 R 的 每 个 元 组 i:。 我 们 会 在 组 分 4 
中 找到 1 的 值 一 一 比方 说 是 a， 并 使 用 该 索引 查找 S 中 4 组 分 的 值 也 为 a 的 元 组 。 如 果 S 中 的 这 一 元 
组 与 相同 ， 就 不 要 再 将 第 二 次 放 入 并 集中 ， 而 如 果 5 中 不 存在 键 的 值 为 的 元 组 ， 或 者 键 值 为 a 
的 元 组 与 不 同 ， 就 要 将 加 入 并 集中 。 

如 果 索 引 提 供 了 在 给 定 元 组 键 值 的 情况 下 每 个 元 组 平均 为 0(1) 的 元 组 查询 时 间 ， 那 么 这 种 
方法 求 并 集 的 平均 时 间 就 与 KR 和 S$ 的 大 小 之 和 成 比例 。 此 外 ， 只 要 R 和 s 都 没有 重复 ， 那 么 得 到 的 
关系 也 是 没有 重复 的 。 

8.8.2 ”投影 的 实现 

原则 上 讲 ， 在 执行 投影 运算 时 ， 只 能 检验 完 每 个 元 组 ， 并 上 略 去 那些 与 未 出 现在 投影 列表 中 
的 属性 对 应 的 组 分 。 索 引 是 一 点 忙 都 帮 不 上 的 。 此 外 ， 在 计算 了 各 元 组 的 投影 后 ， 我 们 可 能 发 
现 会 留 下 很 多 重复 。 

例如 ,假设 有 模式 为 {4，B，C} 的 关系 R， 而 且 要 计算 zz ;(R) 。 尽 管 R 中 的 元 组 不 可 能 4、 
B、C 属 性 全 都 相同 ,但 还 是 可 能 有 很 多 元 组 的 属性 4 和 B 会 相同 而 只 是 对 应 属性 C 的 值 不 同 。 这 
样 一 来 ， 这 些 元 组 在 投影 中 全 都 会 得 到 相同 的 元 组 。 

因此 ， 在 为 某 关 系 R 和 一 列 属性 L 计 算 了 S = x (R) 这 样 的 投影 后 ， 必 须 消除 重复 。 例 如 ， 
可 以 为 8 排序 , 然后 以 排序 的 次 序 检查 所 有 元 组 。 那些 在 次 序 上 与 前 一 个 元 组 相同 的 元 组 都 要 被 
删除 。 另 一 种 消除 重复 的 方式 是 将 关系 $ 看 作 普通 集合 。 每 当 我 们 通过 把 R 的 元 组 投影 到 表 Z 中 
的 属性 上 生成 一 个 元 组 ， 就 将 其 插入 该 集合 中 。 就 像 所 有 向 集 合 插 入 元 素 的 操作 那样 ， 如 果 待 
搬入 的 元 素 已 经 在 集合 中 ， 就 不 用 做 任何 事情 。 散 列表 这 样 的 结构 就 很 适合 表示 由 投影 生成 的 
元 组 构成 的 集合 5。 

如 果 关 系 R 中 有 nn 个 元 组 ， 那 么 要 在 消除 重复 前 为 关系 S 排 序 所 需 的 时 间 为 O(nlogn) 。 而 如 
果 改 为 在 生成 S 的 元 组 时 对 其 执行 散 列 操作 ， 而 且 使 用 数量 与 4 成 比例 的 散 列 表 元 ， 那 么 整个 投 
影 运 算 平均 要 花 O(n) 的 时 间 。 因 此 ， 散 列 通常 要 略 优 于 排序 。 


8.8.3 选择 的 实现 


在 执行 选择 运算 9 = ac(R) 而 且 没 有 R 上 的 索引 时 ， 就 只 能 检查 R 中 的 所 有 元 组 以 应 用 条 件 
C。 不管 如 何 执行 选择 ， 只 要 R 中 没有 重复 ， 得 到 的 S$ 中 就 不 会 有 重复 。 

不 过 ， 如 采 R 上 存在 各 二 索引 ， 束 可 以 利用 其 中 某 一 索引 直接 找到 满足 条 件 C 的 元 组 ， 因 此 
就 可 以 避免 查看 大 多 数 或 是 所 有 不 满足 条 件 C 的 元 组 。 条件 C 形 如 4 =b 时 的 情况 最 简单 , 其 中 4 
是 R 的 某 一 属性 ， 而 2 是 某 常量 。 如 果 R 具 有 4 上 的 索引 ， 就 可 以 通过 在 索引 中 查找 2 来 检索 满足 
该 条 件 的 所 有 元 组 。 
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如 果 条 件 C 是 和 若干 条 件 的 逻辑 AND, 那么 可 以 利用 其 中 某 一 条 件 查 找 使 用 了 索引 的 元 组 , 然 

后 检查 检索 到 的 这 些 元 组 ， 看 看 有 哪些 满足 其 余 的 条 件 。 例 如 ,假设 条 件 C 是 
(4A=a) AND(B=D) 

如 果 这 4 上 的 索引 或 是 B 上 的 索引 中 有 某 一 个 或 全 都 存在 ,就 可 以 选择 使 用 某 一 个 索引 。 假 
设 有 B 上 的 索引 ， 而 且 要 么 4 上 没有 索引 ， 要么 是 我 们 主动 选择 使 用 B 上 的 索引 。 这 样 一 来 ,我 
们 就 会 得 到 关系 R 中 8B 组 分 的 值 为 5 的 所 有 元 组 。 这 些 元 组 中 4 组 分 为 a 的 都 属于 选择 运算 的 结 
果 一 一 关系 S， 而 检索 到 的 其 他 元 组 则 不 属于 。 这 一 选择 运算 所 花 的 时 间 是 与 组 分 的 值 为 5 的 
元 组 数量 ( 通常 在 R 中 的 元 组 数 和 s 中 的 元 组 数 之 间 ) 成 比例 的 。 


8.8.4 ”联接 的 实现 


假设 我 们 想 要 对 模式 为 {4，B} 的 关系 R 和 模式 为 {B，C} 的 关系 S 进 行 自然 联接 。 还 假设 该 联 
接 是 两 个 关系 的 8 属性 之 间 存在 相等 关系 的 自然 联接 。" 如何 执 行 这 一 联接 取决 于 我 们 能 找到 属 
性 B 上 的 何 种 索引 。 该 问题 类 似 于 我 们 在 8.6 节 中 讨论 过 的 那些 ， 当 时 我 们 是 考虑 如 何在 关系 间 
导航 ， 而 导航 的 本 质 就 是 联接 。 

有 一 种 直观 而 缓慢 的 联接 计算 方式 ， 叫 作 谱 套 循 环 联接 。 我 们 会 按照 如 下 方式 对 一 个 关系 
中 的 每 个 元 组 与 男 一 关系 中 的 每 个 元 组 加 以 比较 。 

for R 中 的 各 元 组 rx do 

for S 中 的 各 元 组 s do 
if x 和 s 的 B 属 性 相同 then 
打印 结合 了 r 和 s 的 
属性 4、B、C 的 元 组 : 

然而 ， 还 有 很 多 更 高 效 的 联接 方式 。 索 引 联 接 就 是 其 中 之 一 。 假 设 S 有 属性 B 上 的 索引 。 那 
么 可 以 访问 R 的 各 元 组 :， 并 找到 其 B 组 分 ， 比 方 说 是 bp。 在 S$ 的 索引 中 查找 ;5， 这 样 就 能 得 到 B 的 
值 能 与 匹配 的 所 有 元 组 。 

同样 ， 如 果 R 有 属性 3B 上 索引 ,就 可 以 浏览 $S 的 所 有 元 组 。 对 S 中 的 各 元 组 , 我们 会 使 用 R 的 B 
索引 查找 与 之 对 应 的 R 的 元 组 。 如 果 R 和 S 都 有 属性 B 上 的 索引 ， 就 要 任 选 其 一 来 用 。 正 如 我 们 即 
将 看 到 的 ， 这 会 给 联接 运算 所 花 的 时 间 带 来 变化 。 

如 果 没 有 属性 B 上 的 索引 ， 利 用 排序 联接 还 是 能 比 瞬 套 循环 联接 做 得 更 好 。 首 先 要 将 R 和 5$ 
中 的 元 组 合并 在 一 起 ， 不 过 要 重新 组 织 这 些 元 组 ， 使 得 8B 组 分 成 为 所 有 元 组 的 第 一 个 组 分 ， 而 
且 要 为 它们 加 上 一 个 额外 的 组 分 ， 如 果 该 元 组 来 自 关系 R， 就 加 上 R， 而 如 果 该 元 组 来 自 关 系 S,， 
就 加 上 S。 也 就 是 说 ,来 自 关 系 R 的 元 组 (a，D) 就 成 了 (5，a，R)， 而 来 自 关系 S 的 元 组 (b，c) 则 成 
TT(b, c, S$)o 

我 们 根据 第 一 个 组 分 ( 也 就 是 b ) 来 为 合并 后 的 元 组 表 排 序 。 虽 然 因为 B 值 相同 而 联接 的 两 
个 关系 中 元 组 可 能 混合 在 一 起 了 , 但 是 这 些 元 组 现在 已 经 是 按 着 次 序 连续 排列 了 。” 我 们 会 沿 着 
已 排序 表 癌 下 ,依次 访问 具有 各 给 定 B 值 的 元 组 。 当 到 达 B 值 为 5 的 元 组 时 ,就 可 以 将 R 中 所 有 这 





























(D 这 里 展示 的 两 个 关系 分 别 只 有 一 个 属性 (分别 为 4 和 C ) 没有 涉及 联接 ， 不 过 这 里 提 到 的 想法 显然 可 以 推广 到 具 
有 很 多 属性 的 关系 。 

久 我 们 可 以 在 排序 的 同时 考虑 对 最 后 一 个 元 组 ( 也 就 是 关系 名 ) 加 以 安排 ,使 得 来 自 关系 R 的 具有 给 定 B 值 的 元 组 
一 定 会 位 于 来 自 S 有 着 相同 8 值 的 元 组 之 前 。 这 样 一 来 ， 对 那些 B 值 相同 的 元 组 而 言 ， 来自 R 的 会 完 出 现 ， 然后 是 
来 自 $ 的 那些 。 




















8.8 关系 代数 运算 的 实现 353 





样 的 元 组 与 中 这 样 的 元 组 配对 。 因 为 这 些 元 组 都 有 着 相同 的 3 值 ， 所 以 它们 都 要 联接 ， 而 且 生 
成 联接 后 关系 中 元 组 所 花 的 时 间 是 与 生成 的 元 组 数 成 比例 的 ， 除 非 是 出 现 R 中 没有 元 组 或 $ 中 没 
有 元 组 的 情况 。 即 便 是 在 R 中 没有 元 组 或 中 没有 元 组 的 情况 下 ,所 花 时 间 仍 然 与 3 值 为 5 的 元 组 
的 数量 成 比例 ， 为 的 是 检查 这 些 元 组 并 在 已 排序 表 中 跳 过 这 些 元 组 。 


+ 示例 8.16 

假设 要 联接 图 8-2c 所 示 的 CDH 关 系 与 图 8-2d 所 示 的 CR 关系 。 在 这 里 , 课程 属性 就 扮演 着 属 
性 8 的 角色 ， 日 子 和 时 刻 属性 则 一 起 扮演 属性 4 的 角色 ， 而 教室 属性 就 是 属性 C。CDH 的 6 个 元 
组 和 CR 的 3 个 元 组 首先 会 各 自 加 上 其 关系 名 称 。 这 里 不 需要 重新 排列 组 分 ， 因 为 两 个 关系 中 课 
程 属性 都 是 排 在 第 一 位 的 。 当 我 们 对 元 组 加 以 比较 时 ,首先 要 比较 课程 组 分 ,利用 词典 次 序 确 
定 哪个 课程 名 称 的 次 序 靠 前 。 如 果 不 分 先后 ,也 就 是 说 ， 如 果 课 程 名 称 相同 ， 就 要 比较 最 后 一 
个 组 分 ， 其 中 CDH 要 先 于 CR。 如 果 还 是 不 分 先后 ， 就 可 以 让 其 中 任意 一 个 元 组 先 于 男 一 个 
元 外 

己 排 好 序 的 元 组 如 图 8-17 所 示 。 请 注意 ,该 表 并 非 关 系 ， 因 为 它 所 含 元 组 的 长 度 不 尽 相 同 。 
不 过 , 它 将 对 应 CS101 的 元 组 和 对 应 EE200 的 元 组 组 织 在 一 起 , 这 样 一 来 就 可 以 很 容易 地 联接 这 
些 元 组 分 组 了 。 











CS101 M 9AM CDH 
CS101 W 9AM CDH 
CS101 F 9AM CDH 
CS101 Turing Aud. CR 
EE200 Tu 10AM CDH 
EE200 W l1PM CDH 
EE200 F 10AM CDH 
EE200 25 Ohm Hall CR 
PH100 Newton Lab. CR 








图 8-17 CDH 和 CR 中 所 有 元 组 构成 的 已 排序 表 


8.8.5 ”联接 方法 的 比较 


假设 要 联接 模式 为 {4，B} 的 关系 R 和 模式 为 {(B，C} 的 关系 S， 并 设 R 和 5 分 别 有 r 个 元 组 和 s 
个 元 组 。 还 有 ， 设 联接 中 的 元 组 数 为 m。 要 记 住 ， 如 果 R 的 每 个 元 组 都 与 5 中 的 每 个 元 组 ( 因为 
它们 都 有 相同 的 8B 值 ) 联接 ， 那么 m 可 以 有 rs 那么 大 ， 而 如 果 R 中 没有 元 组 的 8B 值 与 S 中 元 组 的 B 
值 相 等 ,那么 m 还 可 以 小 到 0 这 么 小 。 最 后 ,假设 可 以 在 平均 00) 的 时 间 内 查找 任意 索引 中 的 任 
意 值 ， 就 像 索 引 是 有 着 相当 大 量 的 散 列 表 元 的 散 列 表 时 能 做 到 的 那样 。 

每 种 联接 方法 生产 输出 都 至 少 要 花 O(m) 的 时 间 。 不 过 ， 有 些 方法 所 花 的 时 间 要 更 多 一 些 。 
如 果 使 用 散 套 循环 联接 ， 就 要 花 xs 的 时 间 执 行 比较 。 因 为 m 三 rs ， 所 以 可 以 忽略 生成 输出 所 花 
的 时 间 ， 并 说 配对 所 有 元 组 的 时 间 开 销 为 O(xs) 。 

另 一 方面 ,我 们 可 以 为 这 些 关 系 排序 。 如 果 使 用 类 似 归 并 排序 的 算法 为 含 r+s 个 元 组 的 表 
排序 ， 所 需 的 时 间 就 是 








O(( +s)log(r+ s)) 
要 从 已 排序 表 中 紫 连 的 元 组 构建 输出 元 组 ， 就 要 花 O(r+s) 的 时 间 检 查 该 表 ， 还 要 花 O(m) 
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的 时 间 生 成 输出 。 排 序 所 需 的 时 间 主 导 了 O(r+s) 项 ,不 过 生成 输出 所 花 的 O(m) 既 可 能 大 于 也 
可 能 小 于 排序 的 时 间 。 因 此 通过 排序 进行 联接 的 算法 的 运行 时 间 必 须 包 含 这 两 项 ， 这 一 运行 时 
间 就 是 
O(m+(r+s)log(r +s)) 

因为 m 从 不 会 大 于 rs， 而 且 (x+s)log(r+s) 只 有 在 一 些 人 少见 的 情况 下 才 大 于 rs( 比如 ，1 或 s 
为 0 时 )， 所 以 可 以 说 排序 联接 一 般 而 言 要 比 航 套 循 环 联接 更 快 。 

现在 假设 有 关系 S 中 属性 8 上 的 索引 。 要 花 O(r) 的 时 间 查 看 R 的 各 元 组 并 在 索引 中 查找 这 些 
元 组 的 8B 组 分 的 值 。 这 时 我 们 必须 加 上 检索 对 应 各 B 值 的 匹配 元 组 以 及 生成 输出 元 组 的 时 间 开 和 销 
O(m) 。 因 为 m 既 可 以 大 于 r 也 可 以 小 于 +， 所 以 表示 该 索引 联接 时 间 开 销 的 表达 式 就 是 O(m+7) 。 
同样 ， 如 果 有 关系 R 中 属性 8 上 的 索引 ， 就 可 以 在 O(m+s) 的 时 间 内 执行 该 索引 联接 。 因 为 除了 
某 些 罕见 的 情形 ( 比如 x+s 三 1 ) 之 外 ，r 和 和 s 都 小 于 (r+s)log(r+s)， 所 以 索引 联接 的 运行 时 间 
要 小 于 排序 联接 的 时 间 。 当 然 ， 如 果 想 要 进行 索引 联接 ， 就 需要 联接 中 所 涉及 的 某 一 属性 上 的 
索引 ， 而 排序 联接 则 可 以 对 任意 关系 进行 。 


8.8.6 ”习题 


(1) 假设 图 8-2a 所 示 的 “学 号 -姓名 -地 址 -电话 ”关系 ( SNA4P ) 具有 学 号 属性 ( 键 ) 上 的 主 索引 ， 而 
且 有 电话 属性 上 的 辅助 索引 。 如 果 条 件 C 分 别 为 以 下 3 种 ， 那 么 我 们 该 如 何 最 高 效 地 为 查询 
ac(CSV4P) 计算 回应 ? 

(a) 学 号 = 12345 AND 地 址 关 “45 Kumquat Blvd” 
(b) 姓名 = “C.Brown”AND 电话 = 555-1357 
(c) 姓名 = “C.Brown”oOR 电话 = 555-1357 

(2) 说 明 如 何 通过 为 示例 8.16 中 合并 的 元 组 表 排 序 ， 来 为 图 8-1 中 的 CSG 关 系 与 图 8-2a 中 的 SNA4P 关 系 进 
行 排序 联接 。 假 设 是 想 进行 自然 联接 ， 或 者 说 是 想 要 “学 号 ”组 分 上 的 相等 关系 。 给 出 排序 的 结 
果 ， 就 像 图 8-17 那 样 ， 并 给 出 联接 运算 得 到 的 关系 中 的 元 组 。 

(G3) * 假设 要 联接 关系 R 和 S， 它 们 各 含 n 各 元 组 ， 而 且 结 果 中 有 O(n”) 个 元 组 。 分 别 写 出 利用 以 下 各 
项 技术 进行 联接 时 大 O 运 行 时 间 的 公式 ， 将 其 表示 为 n 的 函数 。 

(a) 骨 套 循环 联接 。 

(b) 排序 联接 。 

(c) 索引 联接 ， 使 用 R 的 联接 属性 上 的 索引 。 
(d) 索引 联接 ,使 用 5 的 联接 属性 上 的 索引 。 

(4)* 我 们 提出 过 利用 作为 某 关系 的 键 的 属性 4 上 的 索引 为 两 个 关系 取 并 集 。 如 果 具 有 索引 的 属性 4 不 
是 键 ， 这 是 否 仍 为 合理 的 取 并 集 方式 ? 

(5) * 假设 想 使 用 R 和 Ss 二 者 之 一 的 某 属性 4 上 的 索引 计算 (a) RMS ; (b) R-S 。 能 否 取得 与 两 个 关系 大 
小 之 和 接近 的 运行 时 间 ? 

(6) 如 果 要 将 关系 R 投 影 到 含有 R 的 键 的 属性 集合 上 ， 是 否 需 要 消除 重复 ?为 什么 ? 


8.9 ”关系 的 代数 法 则 
就 像 其 他 代数 那样 ， 通 过 对 表达 式 进行 变形 ， 通 常 能 “优化 ”表达 式 。 也 就 是 说 ， 我 们 可 


以 接受 一 个 求 值 开销 很 大 的 表达 式 ， 并 将 其 转换 成 求 值 开销 较 小 的 等 价 表达 式 。 对 算术 或 逻辑 
表达 式 的 变形 有 时 能 节省 一 些 运算 ， 而 对 关系 代数 表达 式 进行 合适 的 变形 ， 可 以 节省 几 个 数量 
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级 的 求 值 时 间 。 因 为 优化 过 的 和 未 优化 的 关系 代数 表达 式 在 运行 时 间 上 有 着 巨大 的 差异 ， 所 以 
如 果 程 序 员 要 用 非常 高 级 的 语言 ( 比如 我 们 在 8.7 节 中 提 过 的 SQL 语 言 ) 编程 ， 优 化 这 种 表达 式 
的 能 力 就 是 很 关键 的 。 


8.9.1 涉及 并 交差 的 法 则 


7.3 节 涵盖 了 用 于 集合 并 交差 运算 的 主要 代数 法 则 。 这 些 法 则 也 能 应 用 到 集合 的 特例 ,关系 
上 ， 不 过 读者 应 该 记 住 关系 模型 的 要 求 ， 就 是 运算 所 涉及 关系 的 模式 必须 相同 。 


8.9.2 涉及 联接 的 法 则 


从 某 种 意义 上 讲 ， 联 接 运算 符 是 可 交换 的 ， 而 从 另 一 种 意义 上 讲 ， 它 又 不 是 可 交换 的 。 假 
设 要 计算 自然 联接 Res89， 其 中 R 具 有 属性 4 和 B， 而 %$ 具 有 属性 B 和 C。 和 那么 Rss 的 模式 中 的 各 列 
按 次 序 排列 就 是 4、B、C。 如 果 是 求 $><R， 可 以 得 到 本 质 上 相同 的 元 组 ， 不 过 各 列 的 次 序 是 B、 
C、4。 因 此 ， 如 果 我 们 坚信 各 列 的 次 序 并 非 无 关 紧 要 ， 那 么 联接 就 不 具 交 换 性 。 不 过 ， 如 果 我 
们 认可 连带 列 名 一 起 整 列 交换 的 关系 其 实 是 相同 的 关系 ， 就 可 以 认为 联接 是 可 交换 的 ， 在 这 里 
我 们 要 采纳 这 一 观点 。 

联接 运算 符 并 不 总 是 符合 结合 律 。 例 如 ,假设 有 模式 分 别 为 {4，B}、{B，C} 和 {4，D} 的 3 
个 关系 R、S 和 7。 假设 要 取 自 然 联 接 (Rwa5)><T， 其 中 首先 要 让 R 和 5S 的 B 组 分 相等 ， 接 着 让 结 
的 4 组 分 与 关系 7 的 4 组 分 相等 。 如 果 是 从 右边 关联 ， 就 得 到 Rw (Sw 7)。 关 系 S 和 7 的 模式 分 别 为 
{B，C} 和 {4，D}。 没 有 办 法 选择 令 其 相等 以 达到 自然 联接 效果 的 属性 对 。 

不 过 ， 在 某 些 条 件 下 结合 律 对 联接 运算 来 说 是 成 立 的 。 我 们 将 如 下 公式 的 证 明 留 给 读者 作 
为 练习 








(ee 
只 要 4 是 R 的 属性 ，B3 和 C 是 $ 的 两 个 不 同属 性 ， 而 D 是 7 的 属性 就 行 。 


8.9.3 涉及 选择 的 法 则 


关系 代数 最 实用 的 法 则 涉及 选择 运算 符 。 如 果 选 择 的 条 件 就 像 实践 中 常见 的 那样 是 要 求 指 
定 的 组 分 有 特定 的 值 ， 则 选择 运算 的 结果 关系 中 的 元 组 数 要 比 原 关系 的 元 组 数 少 很 多 。 因 为 一 
般 而 言 当 运算 应 用 到 较 小 的 关系 上 时 所 花 的 时 间 较 少 ， 所 以 尽 可 能 早 地 应 用 选择 运算 是 极为 有 
利 的 。 就 代数 学 而 言 ， 如 果 想 早点 应 用 选择 运算 ， 就 要 动用 代数 法 则 让 选择 运算 符 沿 着 表达 式 
树 向 下 传递 ， 达 到 其 他 运算 符 下 方 。 

这 种 法 则 的 一 个 例子 就 是 














(Gi (RvsS))=(0c(R)rS) 
只 要 条 件 C 中 提 到 的 属性 都 是 关系 R 的 属性 ， 它 就 成 立 。 同样， 如 果 条 件 C 提 及 的 所 有 属性 都 是 S$ 
的 属性 ， 就 可 以 使 用 如 下 法 则 将 选择 运算 符 下 压 到 S 

(ac(ReaS))=(Rraac(S)) 
这 两 条 法 则 都 称 为 选择 的 下 压 ( selection pushing )。 

当选 择 中 的 条 件 很 复杂 时 , 可 能 要 用 一 种 方式 下 压 一 部 分 , 而 用 另 一 种 方式 下 压 另 一 部 分 。 
为 了 将 选择 分 割 为 两 个 或 多 个 部 分 ， 就 需要 法 则 
Ocan p(R)= oc (0,(R)) 
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请 注意 ， 如 果 这 些 分 割 出 的 部 分 用 AND 相 连 ， 就 只 能 将 条 件 分 为 两 个 部 分 一 一 这 里 是 C 和 D。 直 
觉 上 讲 ， 当 我 们 为 C 和 D 这 两 个 条 件 的 AND 进 行 选择 时 ， 要么 是 检查 关系 R 中 的 所 有 元 组 ， 看 看 
这 些 元 组 是 否 同 时 满足 C 和 DD， 要 么 是 检查 R 的 所 有 选择 ， 选 出 那些 满足 条 件 D 的 ， 然 后 再 检查 
满足 条 件 D 的 元 组 ， 看 看 其 中 有 哪些 满足 条 件 C。 我 们 将 该 法 则 称 为 选择 的 分 割 ( selection 
splitting )。 

男 一 种 必要 的 法 则 是 选择 的 交换 律 。 如 果 要 对 某 关 系 应 用 两 次 选择 ， 那 么 应 用 这 些 选择 的 
次 序 是 无 关 紧 要 的 ， 选 出 的 元 组 都 会 是 相同 的 。 我 们 可 以 正式 地 将 其 写 为 ， 对 任何 条 件 C 和 
D， 有 








o. (0,(R))=0, (0.(R)) 


+ 示例 8.17 

我 们 再 来 看 看 8.6 节 中 考虑 过 的 复杂 查询 :“C.Brown 星 期 一 上 午 9 点 在 哪里 ? ”这 一 查询 涉 
及 4 个 关系 上 的 导航 : 

(1) CSG (课程 -学 号 -成 绩 ); 

(2) SN4P (学 号 -姓名 -地 址 -电话 ); 

(3) CDH ( 课程- 日子- 时刻 ); 

(4) CR (课程 -教室 )。 

为 了 得 出 表示 该 查询 的 代数 表达 式 , 首先 可 以 求 这 4 个 关系 的 自然 联接 。 也 就 是 通过 让 学 号 
组 分 相等 连接 CSG 和 SNA4P。 可 以 把 该 运算 视 为 对 “课程 -学 号 -成 绩 ” 元 组 进行 扩展 ， 为 该 元 组 
加 上 所 提 及 学 生 的 姓名 、 地 址 和 电话 号 码 。 当 然 ， 我 们 不 会 希望 用 这 种 方式 存储 数据 ， 因 为 这 
会 迫使 我 们 为 某 学 生 选 修 的 每 门 课程 将 该 学 生 的 这 些 信息 重复 一 遍 。 不 过 ， 我 们 并 不 是 要 存储 
这 些 数据 ， 而 只 是 要 设计 表达 式 计 算 它 。 

通过 让 课程 组 分 相等 ,我 们 要 将 CSGsSV4P 的 结果 与 CDE 联 接 。 这 次 联接 会 取 各 CSG 元 组 
(已 经 扩展 了 学 生 信 息 )， 为 每 个 上 课时 段 制 作 一 个 副本 ， 并 将 各 元 组 扩展 为 具有 一 对 可 能 “日 
子 - 时 刻 ” 值 。 最 后 要 将 (CSCrsSV4P)m CDH 的 结果 与 CR 联接 ， 还 是 让 课程 组 分 相等 ， 结 果 就 
是 通过 添加 带 有 某 一 上 课时 段 所 在 教室 的 组 分 扩展 了 各 元 组 。 得 到 的 关系 模式 为 : 

{ 课 程 ， 学 号 ， 成 绩 ， 姓 名 ， 地 址 ， 电 话 ， 日 子 ， 时 刻 ， 教 室 } 
而 元 组 (c，s，g，,n，a,，p，4d，h，7) 的 含义 就 是 : 

(1) 学 生 s 选 修了 课程 c 并 拿 到 了 ge 的 成 绩 ，; 

(2) 学 号 为 s 的 学 生 的 姓名 是 a， 他 (她 ) 的 地 址 是 a 而 且 电 话 号 人 码 为 p; 

(3) 课程 c 是 在 教室 r 上 课 , 而 且 该 课程 某 一 次 上 课时 间 是 4 日 的 4 时 。 

对 该 元 组 集合 ， 必 须 应 用 将 考量 限制 到 相关 元 组 的 选择 ， 也 就 是 姓名 组 分 为 “C.Brown”， 
日 子 组 分 为 “M”， 而 且 “ 时 刻 ” 组 分 为 “9AM” 的 元 组 。 假设 C.Brown 最 多 选修 了 一 门 在 星期 
一 上 午 9 点 上 课 的 课程 ， 这 样 的 元 组 就 最 多 只 有 一 个 。 因 为 我 们 想 要 的 回应 是 该 元 组 的 “教室 ” 
组 分 ， 所 以 要 通过 投影 到 “教室 ”属性 上 来 完成 表达 式 。 表 示 这 一 查询 的 表达 式 树 如 图 8-18 所 
示 。 它 由 4 路 联接 组 成 ， 接 着 是 选择 ， 然 后 是 投影 。 

如 果 按 照 图 8-18 这 样 的 写法 为 该 表达 式 求 值 ， 就 要 通过 联接 CSG、SN4P、CDH 和 CR 构建 一 
个 巨大 的 关系 ， 然 后 将 其 限制 到 一 个 元 组 ， 再 将 该 元 组 投影 到 一 个 组 分 上 。 请 记 住 ， 由 8.6 节 我 
们 可 知 并 不 一 定 要 构建 如 此 庞大 的 关系 ,而 是 可 以 “将 选择 沿 着 树 向 下 压 ”， 从 而 限制 联接 运算 
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中 涉及 的 关系 ， 因 此 就 大 大 限制 了 我 们 要 构建 的 关系 的 大 小 。 


7 





姓名- “C.Brown”AND 日 子 =“M” AND 时 刻 =“9AM” 


[> CDH 


CSG SNAP 
图 8-18 ”确定 C.Brown 星 期 一 上 午 在 哪里 的 初始 表达 式 


第 一 步 如 图 8-19a 所 示 。 请 注意 ， 选 择 只 涉及 姓名 、 日 子 和 时 刻 属性 。 它 们 中 没有 一 个 来 自 
图 8-18 顶 层 联 接 的 右 操作 数 ， 而 都 来 自 左 侧 ， 也 就 是 CSG、SN4P 和 CDH 的 联接 。 因 此 可 以 将 选 
择 压 到 顶层 联接 之 下 ， 并 只 将 其 应 用 到 该 运算 的 左 操作 数 ， 一 如 我 们 在 图 8-19a 中 所 见 。 

现在 就 没 法 继续 下 压 选 择 运算 符 了 , 因为 所 涉及 的 姓名 属性 来 自 图 8-19a 中 层 联接 的 左 操作 
数 ， 而 其 他 两 个 属性 ， 日 子 和 时 刻 ， 则 来 自 其 右 操 作 数 ，CDH 关 系 。 因 此 必须 分 割 选择 中 的 条 
件 , 它 是 3 项 条 件 的 AND， 可 以 分 割 成 3 个 选择 , 不 过 在 本 例 中 只 要 把 姓名 = C.Brown 这 一 条 件 与 
其 他 两 个 分 开 即 可 ， 分 割 的 结果 如 图 8-19b 所 示 。 

现在 ， 涉 及 日 子 和 时 刻 的 选择 可 以 下 压 到 中 层 联 接 的 右 操作 数 ， 因 为 右 操 作 数 是 同时 有 具 
有 日 子 和 时 刻 属性 的 CDH 关 系 。 然 后 男 一 个 涉及 姓名 的 选择 就 可 以 下 压 到 中 层 联接 的 左 操作 
数 ， 因 为 该 操作 数 是 CSGw<SN4P， 含有 姓名 属性 。 这 两 项 改变 会 带 来 如 图 8-19c 所 示 的 表达 
式 树 。 

最 后 ， 姓 名 上 的 选择 涉及 SV4P 的 属性 ,因此 可 以 将 该 选择 下 压 到 底层 联接 的 右 操作 数 。 这 
一 改变 如 图 8-19d 所 示 。 

现在 该 表达 式 给 我 们 的 计划 与 8.6 节 中 为 该 查询 设计 的 计划 几乎 是 相同 的 。 首 先 从 图 8-19d 
总 的 表达 式 底 层 开 始 ， 找 到 名 为 C.Brown 的 学 生 的 学 号 。 把 姓名 = C.Brown 的 SV4P 元 组 与 CSG 
关系 联接 ， 得 到 C.Brown 选 修 的 课程 。 当 我 们 把 第 二 次 选择 应 用 到 CD 关系 时 ， 就 得 到 星期 一 
上 午 9 点 上 课 的 课程 。 因 此 图 8-19d 所 示 的 中 层 联接 给 了 我 们 C.Brown 选 修了 而 且 在 星期 一 上 午 9 
点 上 课 的 课程 。 而 顶层 联接 则 得 到 这 一 时 间 这 门 课程 上 课 的 教室 ， 而 这 里 的 投影 就 给 出 了 这 些 
教室 作为 回应 。 

这 一 计划 与 8.6 节 中 的 计划 主要 的 差别 在 于 ， 后 者 是 先 将 元 组 中 无 用 的 组 分 投射 走 ， 而 这 
里 的 计划 则 是 要 带 着 这 些 组 分 直到 最 后 。 因 此 要 完成 对 关系 代数 表达 式 的 优化 ， 就 需要 可 以 
将 投影 沿 着 树 向 下 压 的 法 则 。 正 如 我 们 将 在 8.9.4 节 中 看 到 的 ， 这 些 法 则 与 用 于 选择 的 法 则 不 
尽 相 同 。 
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TT 不 
bq bq 
CR 
Og- “C.Brown”AND 日 子 =“M”ANDH 时 刻 =“9AM” Ow 名 = “C.Brown” CR 
2 ”4 有 CH 了 - “wNv ab 时 刻 - “9AM 
D4 CDH m4 
CHG SNAP Bd CDH 
CSG SNAP 
(a) 把 选择 压 到 顶层 联接 之 下 (b) 分 割 选择 
Bd Bd 
m4 CR Pd CR 
Ot “C.Brown”™ of 子 =“M”AND 时 刻 =“9AM” Ba 6 子 =“M”AND 时 刻 =“9AM” 
ba CDH 0 CDH 
CSG SNAP SNAP 
(0) 把 两 个 选择 压 向 不 同 的 方向 (qd) 把 “姓名 ”属性 上 的 选择 压 到 底层 联接 之 下 





图 8-19 ”将 选择 运算 下 压 
8.9.4 涉及 投影 的 法 则 


首先 ， 与 选择 可 以 被 压 到 并 集 、 交 集 或 差 集 之 下 〈 只 要 我 们 将 选择 同时 压 向 两 个 操作 数 ) 
不 同 的 是 ,投影 只 能 压 到 并 集 之 下 。 也 就 是 ， 法 则 
(z,(RUS))=(z,(R UZA(S)) 
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成 立 。 不 过 ，ZAj (RM5S) 不 一 定 等 同 于 。 例如 ,假设 R 和 SS 都 是 模式 为 {4，B} 的 关系 ，R 只 包含 元 
组 (a,，b)， 而 S 只 包含 元 组 (a，c)。 那 么 x CRJmz (CS) 只 含 ( 单 组 分 ) 元 组 (qa), 而 z(RMS) 则 不 
含 元 组 ( 因为 RMS 为 空 )。 因 此 就 有 了 的 情况 。 
(TARMS))# (TRNA(S)) 
A (RMNAL(S) 

将 投影 压 到 联接 以 下 是 有 可 能 的 。 一 般 而 言 ， 我 们 需要 为 联接 运算 的 每 个 操作 数 都 加 上 投 
影 运算 符 。 如 果 有 表达 式 x, (RS) ， 那 么 所 需 的 R 的 属性 是 那些 出 现在 属性 表 Z 中 的 属性 ， 以 
及 联接 运算 所 依据 的 来 自 关系 R 的 属性 4。 同 样 ， 我们 需要 5 中 那些 在 属性 表 L 上 的 属性 ， 以 及 联 
接 依 据 的 属性 3， 不管 3 是 否 在 L 中 。 正 式 地 讲 ， 将 投影 压 到 联接 之 下 的 法 则 是 

(x (Rss)) 十 (x (zw (R) sw (S))) 








其 中 

(1) 表 M 是 由 LL 中 那些 在 R 模 式 中 的 属性 构成 ， 如 果 属 性 4 不 在 LK 中， 就 还 要 加 上 4; 

(2) 表 X 是 由 Z 中 那些 在 $ 模 式 中 的 属性 构成 ， 如 果 属 性 B 不 在 2 中 ， 就 还 要 加 上 B。 

要 注意 到 ， 应 用 这 一 投影 下 压 法 则 的 实用 方式 是 从 左 向 右 应 用 ， 即 便 我 们 因此 引入 了 两 项 
额外 的 投影 而 且 没 有 减少 任何 和 运算。 原因 在 于 ， 尽 早 地 投影 出 那些 可 以 投影 的 属性 (也 就 是 将 
投影 尽 可 能 压 到 表达 式 树 靠 下 的 位 置 ) 通常 是 有 利 的 。 如 果 联 接 属 性 4 不 在 表 L 中 ， 我 们 在 联接 
运算 后 可 能 仍然 要 执行 到 表 L 上 的 投影 运算 。 回 想 一 下 另 一 个 联接 属性 ， 来 自 S 的 8B 属 性， 无 论 
如 何 都 不 会 出 现在 联接 中 。 

有 时 候 ， 表 M 和 (或 ) 表 N 分 别 使 用 R 或 $5 的 所 有 属性 组 成 的 。 如 果 这 样 ， 就 没 理由 执行 这 
一 的 投影 了 ， 因 为 它 是 没有 效果 的 ， 除 非 关 系 的 各 列 可 能 是 种 毫 无 头绪 的 排列 。 因 此 我 们 要 使 
用 如 下 法 则 。 

















AX,(R)=R 

表明 了 表 Z 是 由 有 R 的 模式 中 的 所 有 属性 组 成 的 。 请 注意 这 一 法 则 是 认可 “ 整 列 交换 不 会 改变 
关系 ”这 一 观点 的 。 

还 有 一 种 我 们 不 想 进 行 投 影 的 情况 。 假 设 子 表达 式 x,(R) 是 某 更 大 表达 式 的 一 部 分 ， 并 设 R 是 
单一 关系 而 不 是 涉及 运算 符 的 表达 式 。 还 假设 在 表达 式 树 中 该 子 表达 式 之 上 的 位 置 还 有 男 一 个 投 
影 。 现 在 ， 要 执行 R 上 的 投影 就 要 求 我 们 检查 整个 关系 ， 而 不 管 有 没有 索引 的 人 存在。 如 果 我 们 带 着 
有 R 中 未 在 表 Z 上 的 属性 继续 向 下 ， 直 到 下 一 次 有 机 会 将 这 些 属 性 投影 把， 就 经 常 能 节省 大 量 时间 。 

例如 ， 在 接 下 来 的 示例 中 我 们 将 讨论 子 表达 式 

Tip, #3 CSO) 
它 的 作用 是 去 掉 成 绩 。 因 为 整个 ( 表示 示例 8.17 中 的 查询 的 ) 表达 式 最 终 要 将 焦点 集中 在 CSG 
关系 的 少量 元 组 上 ， 所 以 最 好 是 迟 一 些 青 将 成 绩 投 影 走 ， 这 样 做 就 避免 了 检查 整个 CSG 关 系 。 


+ 示例 8.18 
我 们 将 图 8-19d 变 成 下 压 投影 运算 。 根 节点 处 的 投影 会 首先 被 压 到 顶层 联接 之 下 。 投 影 表 只 有 
“教室 ”组 成 ， 而 联接 运算 两 侧 的 联接 属性 都 是 “课程 ”。 因 此 ,在 左边 我 们 只 投影 到 “课程 ”上 ， 
因为 “教室 ”不 是 左 侧 表 达 式 中 的 属性 。 而 该 联接 的 右 操 作 数 则 要 投影 到 “课程 ”和 “教室 ” 属 
性 上 。 因 为 这 两 个 属性 都 是 操作 数 CR 中 的 , 所 以 可 以 略 去 这 一 投影 。 得 到 的 表达 式 如 图 8-20a 所 示 。 
现在 ， 可 以 将 到 “课程 ”属性 上 的 投影 压 到 中 层 联接 之 下 。 因 为 “课程 ”还 是 联接 运算 两 
边 的 联接 属性 ， 所 以 我 们 在 中 层 联接 下 引入 了 两 个 zi 运算 符 。 由 于 中 层 联 接 的 结果 只 有 “ 课 
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程 ” 属性， 因此 我 们 不 再 需要 该 联接 之 上 的 投影 了 ， 新 表达 式 就 如 图 8-20b 所 示 。 请 注意 ,涉及 











的 两 个 关系 的 元 组 都 只 有 一 个 组 分 “课程 ”的 这 次 联接 ， 其 实 是 集合 的 交集 。 这 是 说 得 通 的 ， 
是 C.Brown 所 选 的 课程 的 集合 与 星期 一 上 午 9 点 上 课 的 课程 的 集合 的 交集 。 
人 和 教案 
| 
[Dd] Dg] 
1 CR [xd CR 
1 区 KK 
夏 课程 区 课程 
Cg | 
oh 于 =“M”AND 时 刻 =“9AM” bq 0 子 =“M”AND 时 刻 =“9AM” 
2 NN 2 Se | 
CSG Oe CDH CSG Oe CDH 
| | 
SNAP SNAP 





(a) 把 投影 压 到 顶层 联接 之 下 


TT 


注 
XX 一 一 舱 


ya 


D4 
课程 全 课程 
日 子 =“M”AND 时 刻 =“9AM” 
Ve ni CDH 
课程 ， 学 号 学 号 


OG 寻 名 = “C.Brown” 


SNAP 





(0) 把 投影 压 到 下 层 联接 之 下 


图 8-20 将 于 





(b) 把 投影 压 到 中 层 联 接 之 下 





Th 


= 


bq CR 
课程 和 训 和 
| 


CH 了 - “M”RAND 时 刻 =“9AM7 


2 


CSG CDH 


GO 得 名 = “C.Brown” 


SNAP 


(gd) 删除 把 成 绩 从 CSG 关 系 中 投影 掉 的 步骤 


影 阿 下 压 


至 此 ， 我 们 需要 将 yg 压 到 底层 联接 之 下 。 两 侧 的 联接 属性 都 是 学 号 ， 因 此 左 侧 的 投影 属 


性 表 就 是 (课程 ， 学 号 )， 而 右 侧 的 则 就 是 学 号 ， 


达 式 如 图 8-20c 所 示 。 


因为 谍 程 不 是 右 侧 表达 式 中 的 属性 。 得 到 的 表 
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最 后 ， 正 如 我 们 在 示例 之 前 的 内 容 中 提 过 的 ， 不 立即 将 CSG 关 系 中 的 成 绩 属性 投影 掉 是 有 
利 的 ,在 该 投影 之 上 我 们 会 遇 到 运算 符 zw ,不 管 怎样 它 都 会 把 成 绩 从 中 去 掉 。 如 末 使 用 图 8-20d 
所 示 的 表达 式 ， 从 本 质 上 讲 就 有 了 8.6 市 中 为 这 一 查询 设计 的 计划 。 也 就 是 说 ， 表 达 式 
Ns (OggrcBrownr(SNAP)) 给 了 我 们 名 为 C.Brown 的 学 生 的 学 号 ， 而 后 面 跟着 投影 zi 的 第 一 次 
联接 就 给 了 我 们 那些 学 生 选 修 的 课程 。 如 果 关 系 SV4P 关 系 有 姓名 属性 上 的 索引 ， 且 CSG 关 系 有 
学 号 属性 上 的 索引 ， 那 么 这 些 运算 就 能 很 快 执行 完 。 
子 表达 式 mo (O08 了 wr nw 时-roam"(CDH)) 的 值 就 是 在 星期 一 上 午 9 点 上 课 的 课程 ， 而 中 层 联 
接 会 将 这 些 结合 求 交 集 ， 以 给 出 姓名 为 C.Brown 的 学 生 选 修了 的 在 星期 一 上 午 9 点 上 课 的 课程 。 
最 后 , 后 面 带 着 投影 的 顶层 联接 会 在 CR 关系 中 查找 这 些 课程 ( 如 果 有 课程 属性 上 的 索引 将 会 是 
很 快 的 操作 )， 并 生成 与 之 关联 的 教室 作为 回应 。 
8.9.5 “习题 
(1)* 证明: 只 要 4 是 R 的 属性 ，B8 和 C 是 S$ 不 同 的 属性 ， 而 且 D 是 7 的 属性 ， 就 有 
(R507)= (Rs) 
为 什么 Bz#C 这 一 条 件 很 重要 ? 提示: 请 记 住 ， 这 样 的 属性 在 联接 执行 时 会 消失 掉 。 
(2)* 证明 : 只 要 4 是 R 的 属性 ，B 是 S$ 的 属性 ，C 是 7 的 属性 ， 就 有 
Use 
(3) 取 8.7 节 习题 (3) 中 的 各 关系 代数 查询 ， 并 将 选择 和 投影 运算 下 压 到 尽 可 能 远 的 位 置 。 
(4) 我 们 来 对 关系 代数 运算 得 到 的 关系 中 元 组 的 数量 进行 如 下 全 面 简化 。 
(i) 每 个 操作 数 关系 含有 1000 个 元 组 。 
(ii) 在 联接 分 别 具 有 n 个 和 m 个 元 组 的 关系 时 ， 得 到 的 关系 中 含有 mn/100 个 元 组 。 
(ii) 在 执行 条 件 为 k 个 条 件 〈 每 个 条 件 都 会 让 一 种 属性 等 于 一 个 常数 值 ) 的 AND 的 选择 时 ， 我 们 将 
关系 的 大 小 除 以 10 和 。 
(iv) 在 执行 投影 时 ， 关 系 的 大 小 不 变 。 
此 外 ， 证 我 们 来 估计 一 下 用 为 每 个 内 部 节点 计算 出 的 关系 大 小 之 和 给 表达 式 求 值 的 开销 。 给 出 图 
8-18、 图 8-19a 到 图 8-10d 和 图 8-20a 到 图 8-20d 中 各 表达 式 的 开销 。 
(5) * 证 明 选 择 的 下 压 法 则 



































(ac(R D4 S)) =(ac(R) ea] S) 
提示 : 要 证 明 两 个 集合 相等 ,通常 最 简单 的 方式 就 是 如 7.3 节 中 描述 的 那样 , 证 明 两 个 集合 互 为 对 
方 的 子 集 。 
(6)* 证 明 以 下 法 则 。 
(a) (oc(RNMS))=(0.(R)N GS)) 
(b) (oc(RUS))= (oc.(R)U Gc(S)) 
(c) (oc(R -5)) = (oi(R) -ac(9)) 
(07)* 给 出 反例 ， 证 明 下 式 不 成 立 。 
(zi(R-S))= (A,(R) -ZA.(S)) 
(8) ** 有 些 时 候 ， 可 以 利用 “等 价 关 系 ” 
Oc(R mS)=(0c(R) sq ac(S)) ( 8.1) 
将 选择 同时 沿 着 联接 的 两 个 方向 下 压 。 
(a) 在 什么 情形 下 (8.1) 式 真正 是 等 价 的 ? 
(b) 如 果 (8.1) 式 是 有 效 的 ， 不 是 将 选择 只 压 向 R 或 只 压 向 5， 那 么 何 时 使 用 该 法 则 会 更 合适 ? 
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8.10 “小 结 


大 家 在 学 习 过 本 章 后 应 该 记 住 以 下 要 点 。 

D 被 称 为 “关系 ”的 二 维 表 是 一 种 多 功能 的 信息 存储 方式 。 

口 关系 中 的 行 称 为 “元 组 ”， 而 列 称 为 “属性 ”。 

口 “ 主 索引 ”将 关系 的 元 组 表示 为 数据 结构 ， 而 且 会 分 配 这 些 元 组 ,使 得 利用 某 些 属性 ( 表 
示 索 引 的 “定义 域 ”) 的 值 的 运算 会 因为 这 种 分 配 变 得 容易 。 

口 关系 的 “ 键 ” 是 能 唯一 确定 该 关系 其 他 属性 的 值 的 属性 构成 的 集合 。 通 常 主 索 引 会 使 用 
键 作为 其 定义 域 。 

口 “辅助 索引 ”这 种 数据 结构 可 以 简化 指定 了 某 一 特定 属性 〈 通 常 不 是 主 索 引 对 应 的 定义 
域 中 的 属性 ) 的 运算 。 

口 关系 代数 是 一 种 高 级 表示 法 ， 用 来 表示 与 一 个 或 多 个 关系 有 关 的 查询 。 其 基本 运算 包括 
并 、 交 、 差 、 选 择 、 投 影 和 联接 。 

口 有 很 多 实现 联接 的 方式 要 比 直观 的 “ 骨 套 循环 联接 ”( 它 会 将 一 个 关系 中 的 各 个 元 组 与 为 
一 个 关系 中 的 各 元 组 一 一 配对 ) 更 高 效 。 索 引 联接 和 排序 联接 的 运行 时 间接 近 于 查看 所 
涉及 的 两 个 关系 并 生成 联接 结果 所 需 的 时 间 。 

口 关系 代数 表达 式 的 优化 可 以 大 大 缩短 表达 式 求 值 的 运行 时 间 ， 因 此 如 果实 践 中 用 于 表示 
查询 的 语言 是 基于 关系 代数 的 ， 这 种 优化 是 很 关键 的 。 

口 改善 给 定 表达 式 运行 时 间 的 方式 有 很 多 种 ， 将 选择 往 下 压 通 党 是 其 中 收益 最 大 的 。 
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图 数据 模型 


从 菏 种 意义 上 讲 , 图 就 是 二 元 关系 。 不过, 它 利用 一 系列 由 线 ( 称 为 边 ) 或 箭头 〈 称 为 弧 ) 
连接 的 点 〈 称 为 节点 ) 提供 了 强大 的 视觉 效果 。 在 这 方面 ， 图 就 是 我 们 在 第 5 章 中 人 研究 过 的 树 数 
据 模 型 的 泛 化 。 和 树 一 样 ， 图 也 有 多 种 形式 : 有 向 图 /无 向 图 ， 以 及 标号 图 /无 标号 图 。 

图 还 和 树 一 样 可 以 解决 大 范围 的 问题 ， 比 如 距离 的 计算 、 关 系 中 环 的 查找 ， 以 及 连通 性 的 
确定 。 我 们 在 第 2 章 中 已 经 见识 过 用 图 来 表示 程序 的 结构 。 而 第 7 章 也 用 到 图 来 表示 二 元 关系 ， 
并 用 图 展示 了 关系 的 茶 些 属性 ， 比 如 交换 律 。 在 第 10 革 中 将 看 到 用 图 表示 自动 机 ， 而 在 第 13 章 
中 会 看 到 用 图 表示 电路 。 而 图 除 上 述 这 些 之 外 的 奉 干 重要 应 用 将 在 本 章 中 讨论 。 


9.1 本草 主 要 内 容 


本 章 的 主要 内 容 包括 以 下 这 些 。 

口 与 有 向 图 和 无 向 图 有 关 的 定义 〈9.2 人 和 9.10T )。 

D 表示 图 的 两 种 重要 数据 结构 :邻接 表 和 邻接 矩阵 (9.3 市 )。 

口 用 来 在 无 向 图 中 找 出 连通 分 支 的 算法 和 数据 结构 ( 9.4 市 )。 

口 找 出 最 小 生成 树 的 技巧 (9.5 节 ) 

D 名 为 “深度 优先 搜索 ”的 用 于 探索 图 的 实用 技巧 (9.6 市 )。 

口 应 用 深度 优先 搜索 测试 有 向 图 是 否 有 环 路 ， 找 出 无 环 图 的 拓扑 次 序 ， 以 及 确定 是 否 存在 
从 一 个 节点 到 男 一 节点 的 路 径 ( 9.7 市 )。 

口 用 来 找 出 最 短路 径 的 迪 杰 斯 特 拉 算 法 ( 9.8 节 )。 该 算法 可 找 出 从 某 个 “ 源 ” 节 点 到 每 个 
节点 的 最 小 距离 。 

D 找 出 任意 两 个 节点 间 最 小 距离 的 弗 洛 伊 德 算法 (9.9 市 )。 

本 章 中 的 很 多 算法 都 是 比 解决 问题 的 直观 方法 更 加 高 效 的 实用 技巧 。 
































9.2 基本 概念 


有 向 图 , 是 由 节点 集合 N 以 及 N 上 的 二 元 关系 4 组 成 的 。 我 们 将 4 称 为 有 向 图 孤 的 集合 , 因此 
弧 是 节点 的 有 序 对 。 

绘 出 的 图 如 图 9-1 所 示 。 各 节点 是 用 圆圈 表示 的 ,节点 的 名 称 就 在 圆圈 中 央 。 我 们 通常 会 
从 0 开始 的 整数 为 节点 命名 ， 或 者 使 用 等 效 的 枚 举 。 在 图 9-1 中 ， 有 点 集合 MU {0，1，2，3，4}。 
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4 中 的 绝 (u，v) 都 是 由 从 wu 到 vy 的 第 头 表 示 的 。 在 图 9-1 中 ， 弧 的 集合 是 
A={(0, 0), (0,1), (0, 2), (1, 3), (2, 0), (2, 1), (2, 4), (3, 2), (3, 4), (4, 1)} 


图 9-1 有 向 图 的 示例 


在 文本 中 , 一 般 习 惯 将 弧 (u,v) 表示 为 u 一 v。 我 们 将 v 称 为 弧 的 关 部 , 而 将 u 称 为 弧 的 尾部 ， 
以 适应 v 在 币 头 的 头 部 而 uw 在 其 尾部 的 概念 。 例 如 ，0 一 1 就 是 图 9-1 中 的 一 条 弧 ， 它 的 头 部 是 方 
点 1, 而 尾部 是 节点 0。 为 一 条 弧 是 0 王 1 , 这 样 一 条 从 某 节 点 通 向 其 自身 的 弧 就 叫 作 自 环 (loop )。 
对 该 弧 而 言 ， 头 部 和 尾部 都 是 节点 0。 


9.2.1 前 导 和 后 继 


当 w 一 vv 是 首 时 , 还 可 以 说 wu 是 v 的 前 导 (predecessor ), 而 且 v 是 的 后 继 (successor )。 因 此 ， 
弧 0 王 1 就 表示 0 是 1 的 前 导 而 1 是 0 的 后 继 ， 而 弧 0 一 0 则 表示 0 同时 是 其 本 里 的 前 导 和 后 继 。 


9.2.2 ”标号 

就 像 对 树 那样 , 也 可 以 为 图 的 各 节点 附加 标号 ( label ), 标号 是 绘制 在 所 对 应 的 节点 附近 的 。 
同样 ， 可 以 在 靠近 弧 中 点 的 位 置 为 弧 放 置 标号 。 节 点 的 标号 或 弧 的 标号 可 以 是 任意 类 型 的 。 例 
如 , 图 9-2 就 展示 了 节点 名 为 1, 标号 为 “ 狗 ”, 节点 名 为 2, 标号 为 “ 猫 ”, 而 且 有 一 条 标号 为 “ 咬 ” 
的 弧 1 一 2。 














图 9-2 含 两 个 节点 的 标号 图 


和 树 一 样 ， 不 应 该 把 节点 的 名 称 与 其 标号 弄 混 。 同 一 幅 图 中 各 节点 的 名 称 必须 是 唯一 的 ， 
但 可 能 有 不 止 一 个 节点 的 标号 相同 。 
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9.2.3 ”路 径 


有 问 图 中 的 路 径 是 一 列 市 点 (i, wm …, 旭 ， 其 中 每 个 节点 都 有 到 下 一 节点 的 弧 ， 也 就 是 
vy 二 vy, ，i=1,2,…, 大 -1。 该 路 径 的 长 度 是 上 -1， 也 就 是 这 条 路 径 上 弧 的 数量 。 例 如 ， 图 9-1 
中 的 (0，1，3) 就 是 一 条 长 度 为 2 的 路 径 。 

K=1 的 情况 也 是 可 以 存在 的 。 也 就 是 说 ,任何 节点 * 本 身 都 是 一 条 从 * 到 v* 的 长 度 为 0 的 路 径 。 
该 路 径 上 没有 弧 。 


9.2.4 ”有 环 图 和 无 环 图 


有 问 图 中 的 环 路 (cycle ) 是 指 起 点 和 终点 为 同一 节点 的 长 度 不 为 0 的 路 径 。 环 路 的 长 度 就 
是 这 条 路 径 的 长 度 。 请 注意 ， 路 径 长 度 为 0 的 情况 不 是 环 路 ， 虽 然 “ 其 起 点 和 终点 是 同一 节点 ”。 
然而 ， 由 一 条 弧 v 一 v 构 成 的 路 径 是 一 条 长 度 为 1 的 环 路 。 


+ 示例 9.1 

考虑 图 9-1 中 的 图 。 因 为 有 自 环 0 瑟 0 ， 存 在 一 条 长 度 为 1 的 环 路 (0，0)。 还 有 一 条 长 度 为 2 
的 环 路 (0,2, 0)， 因 为 有 弧 0 一 2 和 2 一 0 。 同 样 ，(13,2, 1) 是 一 条 长 度 为 3 的 环 路 ， 而 (1 3,2, 4, 1) 
则 是 长 度 为 4 的 环 路 。 

请 注意 ， 环 路 的 起 点 和 终点 可 以 是 其 中 的 任 一 节点 。 也 就 是 说 ， 环 路 ww wm， …, ve V1) 世 可 
以 写 为 (ww,…, Vi Wi, 轨 ， 或 者 写 为 (四 ,网 Vi ww)， 等 等 。 例 如 ， 环 路 (1, 3, 2, 4, 1) 也 可 以 写 
为 (2, 4, 1, 3, 2)。 

在 每 条 环 路 中 ， 第 一 个 节点 和 最 后 一 个 节点 都 是 相同 的 。 如 果 环 路 (vi, mw, …, vi V1) 的 节点 
Vi、…、Vi 中 没有 一 个 出 现 一 次 以 上 ， 就 说 该 环 路 是 简单 环 路 ， 也 就 是 说 ,简单 环 路 的 唯一 重复 
出 现在 最 终 节 点 处 。 


+ 示例 9.2 

示例 9.1 中 的 环 路 都 是 简单 环 路 。 在 图 9-1 中 ， 环 路 (0，2，0) 是 简单 环 路 。 不 过 ， 也 有 些 环 
路 不 是 简单 环 路 ， 比 如 环 路 (0, 2, 1, 3, 2, 0) 中 节点 2 就 出 现 了 两 次 。 

给 定 含 有 节点 vy 的 非 简 单 环 路 ， 就 能 找到 含有 v 的 简单 环 路 。 要 知道 原因 ， 可 以 假设 有 一 条 
起 点 和 终点 都 是 v 的 环 路 (w v1, v2,…, ve v1)。 如 果 该 环 路 不 是 简单 环 路 ， 就 只 会 是 以 下 两 种 情况 
之 一 。 

(1) vv 出现 了 3 次 或 3 次 以 上 ; 

(2) 存在 某 个 vy 之 外 的 节点 wu， 它 出 现 了 两 次 ， 也 就 是 ， 环 路 肯定 是 (v,…, wu,…, 4,…, Vy) 这 
样 的 。 

在 第 (1) 种 情况 下 ， 可 以 直接 删除 倒数 第 二 次 出 现 y 的 位 置 之 前 的 所 有 节点 ， 结 果 是 一 条 从 v 
到 vy 的 更 短 环 路 。 在 第 (2) 种 情况 中 ， 可 以 删除 从 wu 到 ww 的 部 分 , 将 其 用 一 个 u 蔡 代 , 得 到 环 路 (w …， 
u,…, Vv)。 不 管 哪 种 情况 ,得 到 的 结果 肯定 仍然 是 环 路 ， 因 为 结果 中 的 每 条 弧 都 是 原 环 路 中 的 ， 
因此 肯定 是 出 现在 该 图 中 的 。 

在 让 环 路 成 为 简单 环 路 之 前 ， 可 能 有 必要 多 次 重复 该 变形 。 因 为 环 路 在 每 次 迭代 后 总 会 变 
得 更 短 ， 所 以 最 终 一 定 能 得 到 简单 环 路 。 我 们 刚刚 已 经 证 明了 ， 如 果 图 中 有 一 条 环 路 ， 那 么 一 
定 至 少 含有 一 条 简单 环 路 。 
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+ 示例 9.3 

给 定 环 路 (0，2，1，3，2，0)， 可 以 删除 第 一 个 2 以 及 它 后 面 的 1/ 和 3， 这 样 就 得 到 了 简单 环 
路 (0，2，0)。 从 实际 情况 上 讲 ， 该 环 路 是 从 0 开始 ， 到 达 2， 然 后 是 1， 再 是 3， 回 到 2， 最 后 回 
到 0。 第 一 次 到 达 2 时 ， 可 以 假装 这 是 第 二 次 到 达 2， 跳 过 了 1 和 3 ， 然 后 直接 回 到 0。 

再 举 个 例子 ， 考 虑 非 简单 环 路 (0，0，0)。 因 为 0 出 现 了 3 次 ， 所 以 可 以 删除 第 一 个 0， 也 就 
是 删除 倒数 第 二 个 0 之 前 的 所 有 内 容 。 实 际 上 我 们 是 将 绕 着 自 环 0 一 0 行进 两 次 的 路 径 蔡 换 为 统 
行 一 次 的 路 径 。 

如 果 图 中 含 一 条 或 多 条 环 路 ， 就 说 该 图 是 有 环 的 。 如 果 不 含 环 路 ， 就 说 该 图 是 无 环 的 。 而 
根据 刚才 有 关 简 单 环 路 的 论证 ， 当 且 仅 当 图 中 含有 简单 环 路 时 ， 该 图 为 有 环 网 ， 因 为 如 果 该 图 
有 环 路 ， 那 么 它 肯 定 有 简单 环 路 。 


+ 示例 9.4 
我 们 在 3.8 节 中 提 到 过 ， 可 以 用 名 为 “调用 图 ”的 有 向 图 表示 由 一 系列 函数 执行 的 调用 。 图 
中 的 节点 就 是 函数 ， 而 如 果 困 数 p 调 用 了 国 数 DO， 就 有 一 条 听 已 一 O 。 例 如 ， 图 9-3 展 示 了 与 2.9 


方 中 的 归并 算法 对 应 的 调用 图 。 




















图 9-3 ”归并 排序 算法 的 调用 图 


调用 图 中 出 现 的 环 路 意味 着 算法 中 的 递归 。 在 图 9-3 中 有 4 条 简单 环 路 ,分 别 是 围绕 节点 
MakeList、MergeSort、split 和 merge 的 长 度 为 1 的 环 路 。 而 且 每 条 环 路 都 是 自 环 。 回 想 
一 下 ， 这 些 了 因数 都 调用 了 上 自己 ， 因 此 都 是 递归 的 。 到 目前 为 止 ， 函 数 调用 自己 的 递归 是 最 常见 
的 类 型 ， 而 且 这 些 递归 在 调用 图 中 都 是 以 自 环 的 形式 出 现 的 。 我 们 将 这 种 递归 称 为 直接 递归 。 
不 过 , 大 家 偶然 会 看 到 间接 递归 , 也 就 是 调用 网 中 环 路 长 度 大 于 1 的 递归 。 例 如 , 下 岁 就 表示 因 
数 P 调 用 了 羡 数 CD， 而 羡 数 O 调 用 了 因数 尺 ， 困 数 R 回 过 头 来 又 调用 了 上 本数 P。 


oOo 
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9.2.5 ”无 环 路 径 


如 果 路 径 中 没有 节点 出 现 一 次 以 上 ， 就 说 该 路 径 是 无 环 的 。 我 们 刚才 在 证 明 对 每 条 环 路 而 
言 都 存在 一 条 简单 环 路 时 给 出 的 论证 也 说 明了 以 下 原则 。 如 果 存 在 从 zx 到 v* 的 路 径 ， 就 存在 从 zx 
到 vy 的 无 环 路 径 。 要 知道 原因 ， 首 先 看 看 从 u 到 v 的 任意 路 径 。 如 果 存 在 某 个 节点 w( 它 可 能 是 u 
或 v ) 出 现 了 两 次 ， 就 可 以 将 两 个 w 以 及 这 两 个 w 之 间 的 所 有 内 容 用 一 个 w 替 代 。 就 像 环 路 的 情况 
那样 ， 我 们 可 能 不 得 不 多 次 重复 该 过 程 ， 但 最 终 会 将 该 路 径 简化 为 无 环 路 径 。 


+ 示例 9.5 

再 次 考虑 图 9-1 中 的 图 。 路 径 (0，1,，3，2，1，3，4) 是 从 0 到 4 的 包含 了 环 路 的 路 径 。 我 们 可 
以 将 注意 力 放 在 两 个 节点 1 上 ， 并 将 它们 及 其 之 间 的 3 和 2 替换 为 1， 留 下 (0，1，3，4)， 这 是 条 
无 环 路 径 ， 因 为 没有 节点 出 现 了 两 次 。 将 注意 力 放 在 两 个 节点 3 上 也 可 以 得 到 同样 结果 。 


9.2.6 ”无 回 

有 时 候 也 可 以 用 没有 方向 的 线条 ( 称 为 边 ) 连接 节点 。 正 式 地 讲 ， 边 是 两 个 节点 组 成 的 集 
合 。 边 和 am， 妇 表 示 节 点 4 和 v* 是 双向 连通 的 。? 如果 f， 妇 是 边 ， 那 么 节点 zx 和 v 就 是 邻接 的 或 者 说 
是 邻居 。 带 有 边 的 图 ， 也 就 是 有 着 对 称 弧 关 系 的 图 ， 就 称 为 无 向 图 。 
+ 示例 9.6 

图 9-4 表 示 了 夏威夷 群岛 的 部 分 公路 图 。 城市 之 间 的 公路 就 是 用 边 表示 的 , 而 且 边 的 标号 表 
示 的 是 行车 距离 。 将 公路 表示 为 边 而 不 是 弧 是 很 自然 的 ， 因 为 公路 通常 是 双 癌 的 。 




















图 9-4 ”表示 夏威夷 群岛 中 瓦 胡 岛 、 毛 仇 岛 和 夏威夷 岛 ( 左 起 顺 
时 针 排 列 ) 上 的 公路 的 无 向 图 





OD 请 注意 ， 边 必须 刚好 有 两 个 节点 。 由 一 个 节点 构成 的 单一 集 不 是 边 。 因 此 ， 虽然 从 一 个 节点 到 其 自身 的 边 是 可 
以 存在 的 ， 但 从 一 个 节点 到 其 自身 的 自 环 边 是 不 能 存在 的 。 不 过 某 些 “无 向 图 ”的 定义 也 允许 这 种 自 环 存在 。 
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9.2.7 无 向 图 中 的 路 径 和 环 路 


无 问 图 的 路 径 是 各 节点 与 下 一 节点 间 都 由 边 连通 的 节点 列 (w， vw 办。 也 就 是 说 ， 对 
i=1，2，…， 大 -1 而 言 ，{w，val } 是 边 。 请 注意 , 边 作为 集合 ,其 中 的 元 素 是 没有 特定 次 序 的 。 
因此 ， 边 Tw， Vitl } 也 可 以 表示 为 fv， Vi}o 

路 径 (v;，v,，…，vi) 的 长 度 是 -1。 就 像 有 问 图 那样 ， 节 点 本 映 是 一 条 长 度 为 0 的 路 径 。 

在 无 问 图 中 和 定义 环 路 是 有 点 理 手 的 。 问 题 在 于 ， 我 们 不 希望 将 请 如 (w，v， 妇 这 样 只 要 存在 
边 fu， 小 就 存在 的 路 径 视 作 环 路 。 同 样 ， 如 果 G(w，v，，…， 是 条 路 径 ， 我 们 可 以 来 回 罕 越 该 
路 径 ， 但 肯定 不 想 把 如 下 路 径 视 为 环 路 。 

Vi, V2 Ve Ve DVI) 

在 无 器 图 中 定义 简单 环 路 的 最 简单 方式 可 能 是 指 长 度 不 小 于 3 而 且 起 点 和 终点 为 同一 市 点 ， 
而 且 预 期 最 后 的 节点 不 会 与 任何 节点 重复 的 路 径 。 而 无 向 图 中 非 简单 环 路 的 概念 通常 不 怎么 使 
用 ， 所 以 后 面 就 不 继续 讲 这 个 概念 了 。 

和 有 问 环 路 一 样 ， 如 果 两 条 无 向 环 路 是 由 次 序 相同 的 相同 节点 构成 ， 就 可 以 将 它们 视 作 相 
同 环 路 。 如 果 两 条 无 向 环 路 是 由 次 序 相 反 的 相同 节点 构成 ， 那 么 它们 也 是 相同 的 环 路 。 正 式 地 
讲 ， 对 从 1 到 k 的 每 个 i， 简 单 环 路 (Vi ，y，…， 共 与 环 鹭 QV，yi VV， ，…，Vil) 及 环 











路 (ww， Vil,s ”YI，YW，VYVl，“…， va) 都 是 等 价 的 。 
+ 示例 9.7 


在 图 9-4 中 ，( 瓦 西 阿 瓦 ， 珍 珠 城 ， 迈 里 ， 瓦 西 阿 瓦 ) 是 长 度 为 3 的 简单 环 路 。 而 如 果 从 迈 里 
开始 并 沿 着 同样 的 次 序 行经 环 路 ， 它 也 可 以 写 为 等 价 的 ( 迈 里 ， 瓦 西 阿 瓦 ， 珍 珠 城 ， 迈 里 )。 同 
样 ， 也 可 以 从 珍珠 城 开 始 ， 并 治 着 相反 方向 行经 环 路 ， 得 到 等 价 的 环 路 (珍珠 城 ， 迈 里 ， 瓦 西 阿 
瓦 ， 珍 珠 城 )。 

再 举 个 例子 ，( 拉 耶 ， 瓦 西 阿 瓦 ， 珍 珠 城 ， 檀 香山 ， 卡 内 奥 赫 ， 拉 耶 ) 是 一 条 长 度 为 5 的 简单 
环 路 。 


图 9-5 ”习题 (1) 和 习题 (2) 对 应 的 有 问 图 


9.2.8 ”习题 
(1) 考虑 图 9-5 中 的 图 。 


(a) 总 共有 和 多少 条 弧 ? 
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(b) 从 节点 4 到 节点 4 共有 多 少 条 无 环 路 径 ? 它们 分 别 是 什么 ? 
(c) 节点 5b 的 前 导 是 什么 ? 
(d) 节点 2 的 后 继 是 什么 ? 
(e) 总 共有 多 少 条 简单 环 路 ? 列 出 它们 。 不 要 重复 只 有 起 点 不 同 的 路 径 〈 见 习题 (8) ) 。 
(f) 列 出 长 度 最 多 到 7 的 所 有 非 简单 环 路 。 
(2) 通过 将 弧 u 一 v 替换 为 边 fu，v}， 把 图 9-5 所 示 的 图 转换 为 无 向 图 。 
(a) 找 出 从 a 到 qd 的 所 有 无 重复 节点 的 路 径 。 
(b) 包含 全 部 6 个 节点 的 简单 环 路 有 几 条 ? 列 出 这 些 环 路 。 
(c) 节点 a 的 邻居 有 哪些 ? 
(3) * 如 果菜 图 有 10 个 节点 ,那么 它 最 多 可 以 有 多 少 条 弧 ? 它 最 少 可 能 有 多 少 条 弧 ? 一 般 来 说 ， 如 果 
图 有 nn 个 节点 ， 那 么 它 最 多 和 最 少 分别 可 能 含有 多 少 条 弧 ? 
(4)* 针对 无 癌 图 的 边 重复 习题 (3)。 
(5) ** 如 果 某 有 向 图 是 无 环 的 而 且 有 n 个 节点 ， 那 么 它 最 多 可 能 有 多 少 条 弧 ? 
(6) 在 目前 为 止 本 书 介 绍 过 的 内 容 中 找 出 一 个 也 数 间 间接 递归 的 例子 。 
(7) 以 所 有 可 能 的 方式 写 出 环 路 (0，1，2，0)。 
(3)* 设 G 是 有 向 图 ， 并 设 R 是 G 的 环 路 上 的 关系 ， 当 且 仪 当 (w,…, ww 而) 和 (vi, ve 站) 表示 相同 环 路 
时 有 (wi …, wp U1) R G1 …, Vv V1)。 证 明 R 是 G 的 环 路 上 的 等 价 关系 。 
(9) * 如 果 5 是 定义 在 某 图 节点 上 的 关系 ， 当 且 仅 当 x =y 或 者 存在 同时 包含 节点 xz 和 v 的 环 路 时 有 zsv， 
证 明 关 系 S 是 该 图 节点 上 的 等 价 关 系 。 
(10)* 当 讨 论 无 向 图 中 的 简单 环 路 时 ,我 们 提 到 过 如 果 两 条 环 路 有 着 相同 的 节点 ,不 管 是 次 序 相同 还 
是 次 序 相 反 ， 这 两 条 环 路 其 实 都 是 相同 的 。 证明: 由 表示 相同 简单 环 路 的 有 序 对 组 成 的 关系 R 是 





9.3 ”图 的 实现 


实现 图 的 标准 方式 有 两 种 。 一 种 叫 作 邻 接 表 ， 大 致 上 与 二 元 关系 的 实现 方法 类 似 。 第 二 
叫 作 邻接 逢 阵 ， 是 一 种 表示 二 元 关系 的 新 方法 ,而 且 更 适合 表示 那些 有 序 对 数量 占据 了 可 能 在 
某 给 定 定 义 域 中 浮动 的 有 序 对 总 数 很 大 一 部 分 的 关系 。 我 们 将 首先 为 有 向 图 考虑 这 些 表 示 ， 然 
后 再 为 无 向 图 考虑 。 


9.3.1 ”邻接 表 


设 节 点 是 由 整数 0、1、…、MA4X-1 或 者 等 价 的 枚 举 类 型 命名 的 。 一般 而 言 , 我 们 会 使 用 NODE 
作为 节点 的 类 型 , 不 过 可 以 假设 NODE 跟 int 是 一 回 事 。 那么 就 可 以 使 用 7.9 节 介绍 的 一 般 化 的 特 
征 向 量 法 表示 弧 的 集合 ， 这 种 表示 就 叫 邻 接 表 。 我 们 将 链表 的 市 点 定义 如 下 : 

typedef struct CELL *LIST; 

struct CELL { 


NODE nodeName ; 
LIST next; 





3 
然后 创建 数组 : 

LIST successors [MAX]: 

也 就 是 说 ，successor [ul 这 一 项 包含 了 一 个 指针 ， 指 向 由 节点 zx 的 所 有 后 继 组 成 的 
链表 。 
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+ 示例 9.8 
图 9-1 中 的 图 可 以 用 图 9-6 中 的 邻接 表 表 示 。 我 们 已 经 通过 
不 过 节点 的 后 继 可 能 以 任意 次 序 出 现在 其 邻接 表 中 。 


SUCCeSSOIS 


点 编号 为 这 些 邻 接 表 排 过 序 了 








图 9-6 图 9-1 中 的 图 的 邻接 表 表 示 


9.3.2 ”邻接 和 矩阵 
另 一 种 常见 的 有 向 图 表示 方式 是 邻接 矩阵 。 我 们 可 以 创建 如 下 二 维 数组 


BOOLEAN arcs [MAX] [MAX]; 





其 中 如 果 存 在 弧 u 一 v ， 则 arcs [ul [v] 的 值 为 TRUE， 否 则 该 值 为 FALSE。 
+ 示例 9.9 

图 9-1 中 的 图 对 应 的 邻接 和 矩阵 如 图 9-7 所 示 。 用 1 表示 TRUE， 用 0 表示 FALSE。 

0 1 2 3 4 

0 1 1 1 0 0 

1 0 0 0 1 0 

2 TU | 

3 0 0 1 0 1 

4 0 1 0 0 0 


图 9-7 表示 图 9-1 中 的 图 的 邻接 和 矩阵 


9.3.3 ”对 图 的 操作 


如 果 考 虑 一 些 简 单 的 图 操作 ， 就 可 以 看 到 图 的 这 两 种 表示 方法 间 的 不 同 。 最 基本 的 操作 也 
许 就 是 确定 从 节点 wu 到 节点 v 是 否 存在 弧 u 一 v 。 在 邻接 矩阵 中 ， 要 查找 arcs [ul [v] 看 该 项 是 
否 为 TRUE 只 需要 0 (1) 的 时 间 。 








邻接 矩阵 与 邻接 表 的 对 比 


当 图 很 稠密 时 ， 也 就 是 ， 当 弧 的 数量 接近 最 大 可 能 数字 时 ( 对 有 n 个 节点 的 图 来 说 是 )， 
就 倾向 于 选择 邻接 纶 阵 表 示 。 不 过 ， 如 果 图 是 稀 路 的 ， 也 就 是 说 ， 如 果 可 能 存在 的 弧 大 多 数 并 
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未 出 现 ， 那 么 用 邻接 表 表 示 法 就 可 能 节省 空间 。 要 知道 原因 ， 请 注意 表示 含 1 个 节点 的 图 的 邻 
接 和 矩阵 有 斑 位 , 假设 用 1 位 来 表示 TRUE 和 FALSE, 而 不 是 像 本 节 中 已 经 做 过 的 那样 用 整数 表示 。 

在 一 般 的 计算 机 中 , 像 邻 接 表单 元 这 样 的 结构 体 是 由 整数 和 指针 构成 的 , 每 个 结构 体会 使 
用 32 位 表示 整数 ， 并 用 32 位 表示 指针 ， 总 共 需 要 64 人 位。 因此， 如 果 弧 的 数量 为 4， 就 需要 64a 
位 存储 该 链表 ， 而 且 存 放 1 个 表 头 的 数组 还 需要 321 位 。 如 果 有 327 + 644a<n*， 也 就 是 如 果 有 
a<n”/64-n/2， 邻 接 表 就 要 比邻 接 矩 阵 节 省 空间 。 如 果 n 很 大 的 话 ， 就 可 以 会 掉 n/2 这 项 ， 并 近似 
地 将 之 前 的 不 等 式 视 作 a<n”/64， 也 就 是 说 ， 如 果 可 能 存在 的 弧 只 有 不 到 1/64 实 际 出 现 ， 邻 接 表 
就 要 比 令 接 和 矩阵 节省 空间 。 我 们 在 讨论 对 图 的 操作 时 将 更 为 详细 地 论证 这 两 种 表示 法 的 优 劣 。 
下 表 总 结 了 为 多 种 操作 优先 选择 的 表示 法 。 


操 作 稠 密 图 稀疏 图 
查找 弧 邻接 矩阵 氏 可 
找 后 继 皆 可 邻接 表 
找 前 导 邻接 矩阵 岩 可 





使 用 邻接 表 的 话 ， 就 要 找到 对 应 zx 的 邻接 表 的 表 头 ， 需 要 0 (1) 的 时 间 。 然 后 ， 如 果 y 不 在 表 
中 ， 就 要 遍历 该 表 直 到 末端 ， 或 者 如 果 v 存 在 的 话 平 均 要 浏览 该 表 的 一 半 。 如 果 该 图 中 有 a 条 弧 
和 n 个 方 点 ,那么 平均 要 花 O(1+a/n) 的 时 间 来 完成 这 样 的 查找 。 如 果 a 不 大 于 n 乘 以 某 个 常数 因子 ， 
这 个 量 就 是 0 (1)。 不 过 ,在 与 n 相 比 时 ，a 越 大 ,使 用 邻接 表 表 示 法 验证 弧 是 否 出 现 所 花 的 时 间 
就 越 长 。 在 a 大 约 是 n”( 其 最 大 可 能 值 ) 的 极端 情况 下 ， 每 个 邻接 表 中 都 将 近 有 n 个 节点 。 这 种 
情况 下 ， 找 到 某 给 定 的 弧 平 均 要 花 O (n) 的 时 间 。 换 名 话说， 当 我 们 需要 查找 某 给 定 的 孤 时 ， 图 
越 稠 密 ， 就 越 愿 意 选择 邻接 和 矩阵 而 不 是 邻接 表 。 

另 一 方面 , 我 们 经 党 需要 找到 某 给 定 节 点 xz 的 所 有 后 继 。 要 用 邻接 表 找 到 所 有 的 后 继 ， 就 要 
行 向 successor [ul 并 遍历 该 表 ， 平 均 耗 时 O (a/n)。 如 果 a 和 nn 是 近似 的 ， 就 可 以 在 0 (1) 的 时 间 
内 找到 wx 的 所 有 后 继 。 不 过 如 果 使 用 邻接 和 矩阵， 就 必须 检查 节点 zx 所 在 的 那 一 整 行 , 不 管 a 是 多 少 
都 要 花 O (n) 的 时 间 。 因 此 ， 对 每 个 节点 只 有 少量 边 与 之 连接 的 图 来 说 ， 在 需要 检查 某 给 定 节 点 
的 后 继 时 ,使 用 邻接 表 要 比 使 用 邻接 矩阵 快 得 多 。 

不 过 ， 假 设想 要 找到 某 给 定 节 点 v 的 全 部 前 导 。 如 果 用 邻接 矩阵 表示 ， 就 需要 检查 v 所 在 的 
那 一 整 列 ， 如 果 w 所 在 那 行 的 位 置 是 1， 就 意味 着 u 是 vy 的 前 导 。 这 一 检查 要 花费 0 (n) 的 时 间 。 而 
邻接 表 表 示 在 查找 前 导 时 也 帮 不 上 忙 。 必 须 检查 对 应 每 个 节点 u 的 邻接 表 , 看 看 该 表 中 是 否 含有 
y。 因 此 , 我 们 可 能 要 检查 所 有 邻接 表 的 所 有 单元 ， 而 且 很 可 能 将 检查 大 多 数 的 单元 。 因 为 整个 
邻接 表 结 构 中 单元 的 数量 等 于 a， 也 就 是 图 中 弧 的 数量 ， 所 以 使 用 邻接 表 在 售 a 条 弧 的 图 中 找 前 
导 的 时 间 就 是 0 (a)。 在 这 里 ， 邻 接 和 矩阵 表示 法 是 占 优势 的 ， 而 且 图 越 稠 密 ， 这 种 优势 就 越 大 。 









































度 的 问题 
从 节点 vy 出 发 的 弧 的 数量 就 叫 作 vy 的 出 度 。 因此， 节点 的 出 度 等 于 其 邻接 表 的 长 度 ， 还 等 于 
相应 的 邻接 矩阵 中 对 应 v 的 那 行 中 1 的 数量 。 进 入 节点 vy 的 绝 的 数量 叫 作 vy 的 入 度 。 入 度 衡量 的 是 
节点 vv 在 菜 节点 的 邻接 表 中 出 现 的 次 数 ， 而 且 是 相应 的 邻接 佐 阵 中 对 应 v 的 那 列 中 1 的 数量 。 
在 无 向 图 中 ,我 们 不 会 区 分 边 是 从 节点 出 发 还 是 进入 节点 。 对 无 向 图 而 言 ， 节 点 vy 的 度 就 
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是 Vy 的 邻居 的 数量 ， 也 就 是 含有 vy 的 边 {u， 让 的 数量 。 请 记 住 ， 在 集合 中 ,成 员 的 次 序 是 不 重要 
的 ， 所 以 {4， 让 和 {vy， 届 是 相同 的 边 ， 因 此 只 能 计算 一 次 。 而 无 向 图 的 度 则 是 该 图 中 节点 的 度 
的 最 大 值 。 例如， 如 果 将 二 元 关系 看 作 无 向 图 ， 那 么 它 的 度 就 是 3， 因 为 节点 最 多 只 能 与 它 的 
父 节点 、 左 子 节点 和 右 子 节点 之 间 有 边 。 对 有 向 图 而 言 ， 可 以 说 有 向 图 的 入 度 是 其 节点 入 度 的 
最 大 值 ， 同 样 ， 有 向 图 的 出 度 是 其 节点 出 度 的 最 大 值 。 





9.3.4 无 向 图 的 实现 


如 有 果 图 是 无 癌 图， 可 以 假装 每 条 边 都 被 蔡 代 为 两 个 方 品 上 的 弧 ， 并 将 得 到 的 有 问 图 用 邻接 
表 或 邻接 矩阵 表示 出 来 。 如 果 使 用 邻接 和 抢 阵 ， 那 么 该 矩阵 是 对 称 的 。 也 就 是 说 ， 如 果 称 该 矩阵 
为 eqges， 那 么 edges[y][v] = edges[v][u]。 如 果 使 用 邻接 表 表 示 法 ， 那 么 边 fu， 小 就 会 被 表示 两 
次 。 我 们 可 以 在 邻接 表 中 找到 对 应 wu 的 v， 也 可 以 在 该 表 中 找到 对 应 vy 的 x。 这 种 排列 通常 是 实用 
的 ， 因 为 不 可 能 事先 分 辨 出 {fu，v} 这 条 边 是 更 可 能 从 u 到 vyv， 还 是 更 可 能 从 v 到 wu。 


+ 示例 9.10 
考虑 一 下 如 何 表示 图 9-4 的 无 回 图 中 最 大 那 部 分 ， 也 就 是 表示 瓦 衣 岛 6 个 城市 的 那 部 分 。 在 
这 里 我 们 要 忽略 边 的 标号 。 对 应 的 邻接 和 矩阵 表示 就 如 图 9-8 所 示 。 请 注意 ， 该 矩阵 是 对 称 的 。 














拉 陡 卡 内 奥 赫 檀香山 珍珠 城 迈 里 瓦 西 阿 瓦 





拉 耶 0 1 0 0 0 1 

卡 内 奥 赫 1 0 1 0 0 0 
檀香山 0 1 0 1 0 0 
珍珠 城 0 0 1 0 1 1 
迈 里 0 0 0 0 1 

瓦 西 阿 瓦 1 0 0 1 1 0 


图 9-8 ”图 9-4 中 的 无 向 图 的 邻接 矩阵 表示 
图 9-9 展 示 了 该 无 向 图 的 邻接 表 表 示 。 在 两 种 情况 下 ， 我 们 都 要 用 到 枚 举 类 型 


enum CITYTYPE {Laie, Kaneohe, Honolulu, 
PearlCity, Maili, Wahiawa}; 


SUCCeSSOIS 




















Laie WT 
Kaneohe Honolulu 
Henan [ET -eacvT 
peaciy vos | | Wohi | 


Maili PearlCity Wahiawa | 。 


weiava | — rl Lae [村 [Peacew [村 [ea Te 


图 9-9 图 9-4 中 无 向 图 的 邻接 表 表 示 
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来 作为 数组 的 索引 。 这 种 安排 多 少 有 些 刻板 ， 因 为 这 样 定 义 就 没 法 对 该 图 的 节点 集合 进行 
任何 改动 。 不 过 我 们 很 快 就 会 给 出 用 整数 显 式 命名 节点 并 用 城市 名 作为 节点 标号 的 相似 示例 ， 
这 样 在 改变 和 点 集合 方面 会 更 具 灵 活性 。 


9.3.5 标号 图 的 表示 


假设 图 的 弧 ( 如 果 是 无 器 图 就 是 边 ) 带 有 标号 。 在 使 用 邻接 矩阵 时 , 就 可 以 将 表示 弧 u 一 
在 图 中 出 现 的 1 蔡 换 为 该 弧 的 标号 。 而 且 必 须要 有 一 些 可 作为 矩阵 的 项 但 又 不 会 与 标号 混 涌 的 
值 ， 我 们 要 用 该 值 表示 弧 未 出 现 的 情况 。 

如 果 用 邻接 表 表 示 图 , 就 要 为 构成 各 链表 的 单元 添加 一 个 hodeLabel 字 段 。 如 果 存 在 标号 
为 [的 弧 wu 一 v ,那么 在 对 应 节点 的 邻接 表 中 就 会 找到 nodqeName 字 段 为 "而 且 nodeLabe1 字 段 
为 的 单元 。nodqeLabe1 字 段 的 值 就 表示 该 弧 的 标号 。 

我 们 要 用 另 一 种 方式 表示 节点 的 标号 。 对 邻接 矩阵 来 说 , 只 要 创建 另 一 个 名 为 NodeLabels 
的 数组 ， 并 设 NodeLabels [u] 是 节点 zx 的 标号 。 在 使 用 邻接 表 时 ， 已 经 有 了 以 节点 为 索引 的 表 
头 数组 。 我 们 要 把 该 数组 的 元 素 改 为 结构 体 ， 一 个 字段 为 节点 标号 ， 而 另 一 个 字段 为 指 回 邻接 
表 开 头 的 指针 。 


+ 示例 9.11 

我 们 要 再 次 表示 图 9-4 所 示 图 的 较 大 部 分 ， 不 过 这 次 要 加 上 边 的 标号 ， 也 就 是 距离 。 此 外 ， 
要 给 出 节点 的 整数 名 称 ， 从 对 应 拉 耶 的 0 开始 , 按照 顺 时 针 方 回 排列 。 城 市 的 名 称 是 用 节点 的 标 
号 表示 的 。 要 将 节点 标号 的 类 型 定义 为 长 度 为 32 的 字符 数组 。 这 种 表示 方式 要 比 示例 9.10 的 方 
式 更 灵活 ， 因 为 如 果 要 在 数组 中 分 配额 外 的 位 置 ， 就 可 以 在 想 要 添加 城市 时 如 愿 以 偿 。 得 到 的 
图 重 绘 为 图 9-10 的 样子 ， 而 对 应 的 邻接 矩阵 表示 如 图 9-11 所 示 。 


拉 耶 























返 里 (4) 1 (5 ) 瓦 西 阿 下 卡 内 奥 赫 


簿 香山 
珍珠 城 
图 9-10 ”节点 名 称 为 整数 而 标号 为 城市 名 的 瓦 胡 岛 地 图 
请 注意 ， 这 一 表示 其 实 有 两 个 部 分 ，cities 数 组 ， 指 示 从 0 到 5 的 整数 代表 的 城市 ， 以 及 
distances 和 矩阵 , 指示 边 是 否 出 现 以 及 出 现 的 边 的 标号 。 我 们 用 不 会 被 误解 为 标号 的 值 -1 表示 
未 出 现 的 边 ， 因 为 在 本 例 中 ， 标 号 是 表示 城市 间距 离 的 ， 它 肯定 是 正 数 。 
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15 —1 
图 9-11 有 向 图 的 邻接 矩阵 表示 
可 以 将 该 结构 体 声明 如 下 : 


typedef char CITYTYPE[32] ; 
typedef CITYTYPE cities [MAX] ; 
int distances [MAX] [MAX] ; 


这 里 的 M4X 是 至 少 为 6 的 某 个 数字 , 它 限 制 了 可 以 出 现在 图 中 的 节点 数 。CITYTYPE 被 定义 
为 长 度 为 32 的 字符 数组 ， 而 且 数 组 cities 给 出 了 各 节点 的 标号 。 例 如 ， 可 以 预期 cities[0] 是 
"Laie" ( 拉 耶 )。 

还 可 以 用 邻接 表 表 示 图 9-10 所 示 的 图 。 假 设 浓 量 M4X 和 CITYTYPE 类 型 都 与 上 面 的 定义 相 
同 。 我 们 可 以 将 CELL 和 LIST 类 型 定义 为 

typedef struct CELL *LIST; 

struct CELL { 

NODE nodeName ; 
int distance ; 
LIST next; 

有 

接 下 来 ， 要 将 cities 数 组 声明 为 

struct { 

CITYTYPE city; 


LIST adjacent; 
} cities[MAX] ; 


图 9-12 展 示 了 用 这 种 方式 表示 的 图 9-10 所 示 的 图 。 
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图 9-12 具有 节点 标号 和 边 标 号 的 图 的 邻接 表 表 示 
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9.3.6 ”习题 


(1) 分 别 用 
(a) 邻接 表 
(b) 邻接 矩阵 

表示 图 9-5( 见 9.2 节 的 习题 ) 所 示 的 图 ， 在 每 种 情况 下 都 给 出 合适 的 类 型 定义 。 

CO) 假设 图 9-5 中 的 弧 都 是 边 ， 即 将 图 变 成 无 向 图 。 针 对 该 无 向 图 重复 习题 (1)。 

(3) 为 图 9-5 中 有 向 图 的 弧 加 上 标号 , 标号 是 由 弧 的 尾部 跟 上 弧 的 头 部 组 成 的 长 度 为 2 的 字符 串 。 例 如 ， 
弧 a 一 5b 的 标号 就 是 字符 串 ap。 还 有 ， 假设 节点 的 标号 是 对 应 其 名 称 的 大 写字 母 。 比 如 名 为 a 的 
节点 的 标号 就 是 A。 针 对 该 带 标号 的 有 向 图 重复 习题 (1)。 

(4)* 无 标号 图 的 邻接 矩阵 表示 与 弧 集 合 的 特征 向 量 表示 有 何 关系 ? 

(5) * 通过 对 xz 的 归纳 证 明 ， 在 含 * 个 节点 的 无 向 图 中 ， 节 点 度 的 和 是 边 数 的 两 倍 。 注 意 。 不 使 用 归纳 
法 也 是 可 以 证 明 该 命题 的 ， 不 过 这 里 要 求 大 家 使 用 归纳 法 证 明 。 

(6) 设计 算法 ， 在 有 向 图 的 (a) 邻 接 和 矩阵 ; (b) 邻 接 表 表 示 中 插 人 和 删除 弧 。 

(7) 针对 无 向 图 重复 习题 (6)。 

(8) 我 们 可 以 为 有 向 图 或 无 向 图 的 邻接 表 表 示 增 加 “前 导 表 ”。 在 执行 以 下 哪些 操作 时 ， 会 选择 这 种 
表示 ? 

(a) 查找 弧 。 
(b) 找 出 所 有 后 继 。 
(c) 找 出 所 有 前 导 。 
在 分 析 中 要 同时 考虑 稠密 图 和 稀 琉 图 的 情况 。 


9.4 无 问 图 的 连通 分 文 


我 们 可 以 将 任意 无 向 图 分 解 为 一 个 或 多 个 连通 分 支 (connected component )。 连 通 分 支 是 节 
点 的 集合 ， 分 支 的 任意 成 员 之 间 都 是 存在 路 径 的 。 此 外 ， 连 通 分 支 是 极 大 的 ， 也 就 是 说 ， 连 通 
分 支 中 的 节点 没有 与 分 文 外 的 任意 节点 连接 的 路 径 。 如 果 图 是 由 单个 连通 分 文 组 成 的 ， 那 么 就 
说 该 图 是 连通 图 。 
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连通 分 支 的 物理 解释 


如 果 给 定 了 绘制 出 的 无 向 图 , 就 很 容易 看 出 连通 分 支 。 将 边 想 象 成 弦 。 如果 拿 起 任 一 节点 ， 
ed 作为 的 连通 分 支 就 会 随 之 而 来 ,而 其 他 连通 分 ee 则 会 待 在 原 地 。 当 然 ， 
文 些 “眼球 ”很 容易 完成 的 任务 让 计算 机 完成 起 来 却 不 一 定 很 容易 。 找 出 图 中 连通 分 支 的 算法 
本 节 oe 


0 





+ 示例 9.12 

再 次 考虑 图 9-4 中 有 关 夏 威 夷 群 鸟 的 图 。 其 中 含有 3 个 连通 分 六 ,分别 对 应 3 个 咏 。 最 大 的 分 
文 是 由 拉 耶 ( Laie )、 卡 内 奥 赫 ( Kaneohe )、 檀香山 (Honolulu )、 珍珠 城 ( Pearl City )、 迈 里 ( Maili ) 
和 瓦 西 阿 瓦 ( Wahiawa ) 组 成 的 。 这 些 城 市 都 是 在 瓦 胡 岛 上 ， 而 且 它 们 显然 是 由 公路 (也 就 是 
边 的 路 径 ) 相互 连接 。 还 有 ， 瓦 胡 岛 上 的 公路 是 没 法 连接 到 其 他 岛 的 。 按 照 图 论 的 说 法 就 是 ， 
在 图 9-4 中 ， 不 存在 从 上 面 提 到 的 这 6 个 城市 到 其 他 城市 的 路 径 。 

第 二 个 分 支 是 由 毛 伊 岛 上 的 城市 拉 海 纳 (Lahaina )、 卡 胡 卢 伊 (Kahului )、 哈 纳 (Hana ) 和 
凯 奥 凯 阿 ( Keokea ) 组 成 的 。 第 三 个 分 支 是 夏威夷 “大 岛 ” 上 的 城市 希 洛 ( Hilo )、 科 纳 ( Kona ) 
和 卡 姆 埃 拉 (Kamuela )。 


9.4.1 ”作为 等 价 类 的 连通 分 支 


男 一 种 看 待 连通 分 文 的 实用 方式 就 是 将 其 视 为 等 价 关 系 P 上 的 等 价 类 , 其 中 P 是 定义 在 无 问 
图 节点 上 的 关系 ， 当 且 仅 当 存在 从 zx 到 的 路 径 时 有 wzPyv。 很 容易 验证 P 是 等 价 关系 。 

(1) P 是 自 反 的 ， 也 就 是 说 ， 对 任意 节点 ww 有 uPu， 因 为 从 任意 节点 到 其 自身 都 有 长 度 为 0 的 
路 径 。 

(2) P 是 对 称 的 。 如 果 uPv， 那么 存在 从 zx 到 v* 的 路 径 。 因 为 该 图 是 无 向 图 ,所 以 相反 的 节点 序 
列 也 是 路 径 。 因 此 有 vPu。 

(3) P 是 传递 的 。 假 设 wPw 和 wPv 都 成 立 ， 那 么 存在 从 u 到 w 的 路 径 ， 比 方 说 是 

(xl X2, …， Xj) 

这 里 有 u=x 且 w=xj。 还 有 ， 存 在 从 w 到 vy 的 路 径 @y1,y,…, 力 )， 其 中 w= 而 且 v = yy。 如 有 果 

将 这 些 路 径 连接 在 一 起 ， 就 得 到 了 从 xz 到 v 的 路 径 ， 即 


(4 = X1, X2， XW, 2, ,yk = Vv) 


























+ 示例 9.13 

考虑 图 9-10 中 从 檀香山 到 迈 里 的 路 径 ( 檀 香山 ,珍珠 城 ， 瓦 西 阿 拟 ， 迈 里 )。 再 考虑 该 图 中 从 
迈 里 到 拉 耶 的 路 径 ( 迈 里 ， 珍 珠 城 ， 瓦 西 阿 瓦 ， 拉 耶 )。 如 果 将 这 两 条 路 径 连 在 一 起 ， 就 得 到 了 
从 檀香山 到 拉 耶 的 路 径 : 

(檀香山 ， 珍 珠 城 ， 瓦 西 阿 瓦 ， 匹 里 ， 珍 珠 城 ， 瓦 西 阿 瓦 ， 拉 耶 ) 

这 条 路 径 刚 好 是 条 环 路 。 正 如 在 9.2 节 中 提 过 的 ， 我 们 总 是 能 删除 环 路 得 到 无 环 路 径 。 在 这 
种 情况 下 ， 要 消除 环 路 ， 一 种 方法 就 是 将 两 个 瓦 西 阿 瓦 以 及 它们 之 间 的 节点 用 一 个 瓦 西 阿 瓦 替 
代 ， 得 到 从 檀香山 到 拉 耶 的 无 环 路 径 

(檀香山 ， 珍 珠 城 ， 瓦 西 阿 瓦 ， 拉 耶 ) 
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因为 P 是 等 价 关系 ， 所 以 它 把 问题 中 无 向 图 节点 的 集合 分 成 了 等 价 类 。 包 含 节 点 v 的 类 就 是 
满足 vPu 的 所 有 节点 wu 的 集合 。 此 外 ,等 价 类 的 其 他 属性 还 有 ， 如 果 节 点 wu 和 vy 在 不 同 的 等 价 类 中 ， 
那么 不 可 能 有 xzPy, 也 就 是 说 不 存在 从 一 个 等 价 类 中 的 某 节 点 到 另 一 等 价 类 中 节点 的 路 径 。 因 此 ， 
由 “路 径 ” 关 系 P 定 义 的 各 等 价 类 就 是 该 图 的 各 连通 分 支 。 

9.4.2 计算 连通 分 支 的 算法 

假设 我 们 想 构 建 图 G 的 连通 分 支 。 一 种 方式 是 从 G 中 没有 边 的 节点 组 成 的 图 Go 开始 。 然 
后 考虑 G 的 边 ， 一 次 一 条 ， 构 建 一 系列 的 图 G。、G1、…， 其 中 Gi 是 由 G6 的 节点 和 G 的 前 i 条 边 
构成 的 。 

依据 。Go 是 由 G 中 没有 边 的 节点 组 成 。 每 个 节点 本 身 是 一 个 分 支 。 

归纳 。 假 设 在 考虑 了 前 i 条 边 后 得 到 了 图 G 的 连通 分 支 ， 现 在 考虑 第 计 1 条 边 : {fu，v}。 

(1) 如 果 w 和 vw 在 G 的 同一 分 支 中 ， 那 么 Gi 有 着 与 Gj 相同 的 连通 分 支 集 合 ， 因 为 这 条 新 的 边 
不 会 连接 到 任何 尚未 连通 的 节点 。 

(2) 如 果 w 和 vw 在 不 同 分 支 中 , 我 们 可 以 合并 包含 wu 和 v 的 分 支 , 得 到 Gi 的 连通 分 支 。 图 9-13 
解释 了 为 什么 存在 从 wu 所 在 分 支 中 任 一 节点 x 到 v 所 在 分 支 中 任 一 节点 y 的 路 径 。 我 们 沿 着 第 一 
个 分 支 中 从 x 到 wu 的 路 径 走 ， 然 后 到 边 {nu，v} ， 最 后 经 过 已 知 存 在 于 第 二 个 分 支 中 的 从 v 到 y 的 
路 径 。 

当 以 这 种 方式 考虑 过 所 有 的 边 时 ， 就 得 到 了 全 图 的 连通 分 支 。 



































图 9-13 ”添加 连接 了 含 u 的 分 支 与 含 v 的 分 支 的 边 {4，V} 


+ 示例 9.14 

来 考虑 一 下 图 9-4 中 的 图 。 虽 然 我 们 能 够 以 任意 次 序 考 虑 这 些 边 ， 不 过 为 了 9.5 节 中 某 一 算 
法 的 需要 ， 在 这 里 按照 边 标 号 从 小 到 大 的 次 序列 出 了 这 些 边 。 边 的 列表 如 图 9-14 所 示 。 

首先 ， 所 有 13 个 节点 都 在 它们 各 自 的 分 支 中 。 当 考虑 1 号 边 { 玉 内 奥 南 ,檀香山 } 时 ,我们 就 
将 这 两 个 节点 合并 到 了 一 个 分 支 中 。 而 第 二 条 边 { 瓦 西 阿 瓦 ， 珍 珠 城 } 则 合并 了 这 两 个 城市 。 第 
三 条 边 是 {珍珠 城 ， 檀 香山 }， 这 条 边 把 包含 这 两 个 城市 的 分 支 合 并 了 。 至 此 ， 这 些 分 支 各 含 两 
个 城市 ， 所 以 就 有 了 具有 4 个 城市 的 分 支 ， 即 { 瓦 西 阿 瓦 ， 珍 珠 城 ， 术 香山 ， 卡 内 奥 赫 }。 而 所 有 
其 他 城市 都 还 在 它们 自己 的 分 文中 。 
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边 城市 1 城市 2 距 离 
1 卡 内 奥 替 檀香山 11 
2 瓦 西 阿 瓦 珍珠 城 12 
3 珍珠 城 檀香山 13 
4 瓦 西 阿 瓦 迈 里 15 
5 卡 胡 卢 伊 凯 奥 凯 阿 16 
0 迈 里 珍珠 城 20 
7 拉 海 纳 卡 胡 卢 伊 22 
8 拉 耶 卡 内 奥 替 24 
9 拉 耶 瓦 西 阿 瓦 28 
10 科 纳 卡 姆 埃 拉 31 
11 卡 姆 埃 拉 希 洛 45 
12 卡 胡 卢 伊 哈 纳 60 
13 科 纳 希 洛 114 





图 9-14 ”以 标号 为 次 序 的 图 9-4 中 的 边 

4 号 边 是 { 迈 里 , 也 西 阿 瓦 } , 并 且 将 迈 里 添加 到 大 分 文中 ,第 5 条 边 是 { 卡 胡 卢 伊 , 凯 奥 凯 阿 }， 
它 将 这 两 个 城市 合并 到 一 条 分 文中 。 当 考虑 6 号 边 { 迈 里 ,珍珠 城 } 时 ,我 们 看 到 了 新 现象 : 这 条 
边 的 两 端 已 经 存在 于 相同 的 分 文中 。 因 此 我 们 不 再 合并 6 号 边 。 

7 号 边 是 { 拉 海 纳 ， 卡 胡 卢 伊 }， 它 将 节点 拉 海 纳 添加 到 了 分 支 { 卡 胡 卢 伊 , 凯 奥 凯 阿 } 上, 形 
成 了 分 支 { 拉 海 纳 ， 卡 胡 卢 伊 , 凯 奥 凯 阿 }。 而 8 号 边 则 将 拉 耶 添加 到 了 最 大 的 分 支 上 ,最 大 分 支 
现在 就 成 了 : 

{ 拉 耶 ， 卡 内 奥 赫 ， 楂 香山， 珍珠 城 ， 瓦 西 阿 拟 ， 迈 里 } 

第 九条 边 { 拉 耶 ， 瓦 西 阿 瓦 } 连 接 了 该 分 文中 的 两 个 城市 ， 因 此 被 忽略 掉 。 

10 号 边 将 卡 姆 埃 拉 和 科 纳 组 成 一 条 分 支 ， 而 且 11 号 边 为 这 一 分 支 添 加 了 希 洛 。12 号 边 则 将 
哈 纳 添加 到 了 { 拉 海 纳 ， 卡 胡 卢 贫 ， 凯 奥 凯 阿 } 这 一 分 文中 。 最 后 ，13 号 边 { 硕 洛 ， 科 纳 } 连 接 的 
是 已 经 存在 于 同一 分 文中 的 两 个 城市 。 因 此 ， 最 后 总 共有 如 下 几 个 连通 分 文 。 

{ 拉 耶 ， 卡 内 奥 赫 ， 楂 香山， 珍珠 城 ， 瓦 西 阿 拟 ， 迈 里 } 

{ 拉 海 纳 ， 卡 胡 卢 伊 ， 凯 奥 凯 阿 ， 哈 纳 } 

{ 卡 姆 埃 拉 ， 希 洛 ， 科 纳 } 


9.4.3 ”用 于 形成 分 支 的 数据 结构 


如 果 非 正式 地 考虑 9.4.2 节 中 描述 的 算法 ， 我 们 需要 能 迅速 完成 以 下 两 项 工作 : 

(1) 给 定 某 节 点 ， 找 出 其 当前 所 在 分 文 ; 

(2) 将 两 个 分 支 合并 为 一 个 分 支 。 

有 很 多 种 数据 结构 可 以 支持 这 些 操 作 。 我 们 将 研究 一 种 简单 却 又 能 带 来 极 佳 性 能 的 想法 。 
关键 在 于 将 每 个 分 支 中 的 节点 都 放 进 一 棵 树 中 。" 分 支 是 由 树 的 根 表示 的 。 上 述 两 项 操作 现在 可 
以 按照 如 下 方式 实现 。 




















J 请 务必 理解 ， 在 接 下 来 的 内 容 中 ,“ 树 ”和 “图 ” 指 的 是 不 同 的 结构 。 图 的 节点 与 树 的 节点 间 存 在 一 一 对 应 ,也 
就 是 说 ， 每 个 树 节 点 都 表示 一 个 图 节点 。 不 过 ， 树 中 父子 节点 之 间 的 边 并 不 一 定 是 图 中 存在 的 边 。 
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(1) 要 找到 图 中 市 点 的 分 文 ,就 要 找到 该 节点 在 树 中 的 代表 , 然后 沿 着 树 中 的 路 径 到 达 表 示 
该 分 支 的 根 节 点 。 
(2) 要 合并 两 个 不 同 的 分 支 ， 我 们 就 要 让 一 个 分 文 的 根 节 点 成 为 另 一 分 文 根 节点 的 子 节 点 。 


+ 示例 9.15 

我 们 遵循 示例 9.14 介 绍 的 步骤， 展示 按照 特定 步骤 创建 的 树 。 首 先 ， 每 个 节点 本 身 都 是 一 
棵 单 节 点 树 。 而 第 一 条 边 { 卡 内 奥 灰 ， 模 香山 } 会 让 我 们 把 两 棵 单 节 点 树 { 卡 内 奥 赫 } 和 { 模 香山 } 
合并 为 一 棵 双 节 点 树 { 卡 内 奥 赫 ， 模 香山 }。 任 何 一 个 节点 都 可 以 作为 另 一 个 的 子 节 点 。 不 过 在 
这 里 假设 模 香 山 是 根 节 点 卡 内 奥 赫 的 子 节 点 。 

同样 , 第 二 条 边 { 瓦 西 阿 瓦 , 珍珠 城 } 合 并 了 两 棵 单 节点 树 , 而 且 可 以 假设 珍珠 城 是 根 节点 瓦 
西 阿 瓦 的 子 节 点 。 至 此 ， 当 前 的 分 支 集合 可 以 用 图 9-15 所 示 的 两 棵 树 以 及 9 棵 单 节 点 树 来 表示 。 





瓦 西 阿 瓦 卡 内 奥 赫 
珍珠 城 檀香山 


图 9-15 合并 分 支 得 到 的 前 两 棵 重要 的 树 


第 三 条 边 {珍珠 城 ， 檀 香山 } 合 并 了 这 两 个 分 支 。 假 设 瓦 西 阿 瓦 是 男 一 个 根 节 点 卡 内 奥 赫 的 
子 节 点 。 那 么 得 到 的 分 文 就 可 以 用 图 9-16 中 的 树 表 示 。 
卡 内 奥 赫 


瓦 西 阿 瓦 。 ”檀香山 


珍珠 城 
图 9-16 ”表示 含 4 个 节点 的 分 支 的 树 


当 考 虑 第 四 条 边 { 瓦 西 阿 瓦 ， 迈 里 } 时 ， 就 要 把 迈 里 合并 到 用 图 9-16 中 的 树 表 示 的 分 支 中 。 
既 可 以 把 迈 里 作为 卡 内 奥 赫 的 子 节 点 ， 也 可 以 将 卡 内 奥 赫 当 作 迈 里 的 子 节 点 。 不 过 这 里 选择 前 
者 ， 因 为 这 样 可 以 让 树 的 高 度 保持 比较 小 的 值 ， 而 让 大 分 支 的 根 节 点 作为 小 分 文 根 节 点 的 子 季 
点 会 让 树 中 的 路 径 变 得 更 长 。 在 确定 节点 的 分 文 时 ， 长 路 径 会 让 我 们 要 花 更 多 时 间 才 能 沿 痢 路 
径 到 达 根 节点 。 通过 遵循 这 样 的 策略 , 并 在 分 文 高 度 相同 时 作出 任意 觉得 , 我 们 可 能 得 到 图 9-17 
中 表示 3 条 最 终 连 通 分 支 的 3 棵 树 。 


迈 里 瓦 西 阿 瓦 檀香山 拉 耶 
| 
珍珠 城 
卡 胡 卢 伊 卡 姆 埃 拉 
拉 海 纳 凯 奥 凯 阿 哈 纳 科 纳 希 洛 


图 9-17 使 用 树 合 并 算法 表示 最 终 连通 分 支 的 树 
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遵循 示例 9.15 中 的 经 验 ， 我 们 制订 了 这 样 的 策略 ， 在 合并 两 棵 树 时 ， 高 度 较 小 的 根 节 点 要 
成 为 高 度 较 大 的 根 节点 的 子 节 点 。 如 果 出 现 高 度 相等 的 情况 就 任 选 一 种 方式 。 从 这 一 策略 中 得 
到 的 重要 收获 就 是 树 的 高 度 只 能 以 树 中 节点 数 对 数 的 速度 增长 ， 而 且 在 实践 中 ， 树 的 高 度 往往 
还 更 小 。 因 此 ， 当 沿 着 一 条 路 径 从 树 的 节点 到 达 其 根 节点 时 ， 所 花 的 时 间 最 多 与 树 中 节点 数 的 
对 数 成 比例 。 我 们 可 以 通过 对 高 度 h 的 归纳 证 明 如 下 命题 ， 从 而 得 出 这 一 对 数 边界 。 

命题 S(1)。 按 照 将 较 低 高 度 合并 到 较 高 高 度 的 策略 形成 的 高 度 h 的 树 ， 至 少 有 2 个 节点 。 

依据 。 依 据 是 h=0。 这 样 的 树 肯 定 只 有 一 个 节点 ， 而 且 因 为 2 = 1， 所 以 命题 $(0) 成 立 。 

归纳 。 假 设 S(h) 对 某 个 三 0 成立， 并 考虑 高 度 为 h+1 的 树 T7。 在 通过 合并 形成 7 的 过 程 中 
的 某 个 时 刻 ， 树 的 高 度 第 一 次 达到 有 +1。 让 树 的 高 度 达 到 及 +1 的 唯一 方式 就 是 让 某 高 度 为 的 
树 妃 的 根 节点 成 为 某 树 胞 根 节点 的 子 节点 。7 是 妃 加 上 胞 ， 可 能 还 要 加 上 一 些 后 来 要 加 上 的 其 他 
节点 ， 如 图 9-18 所 示 。 














图 9-18 ”形成 高 度 为 h+1 的 树 
现在 ,根据 归纳 假设 ,7 至 少 有 2 个 节点 。 因 为 它 的 根 节点 成 为 了 DD 根 节点 的 子 节点 ， 所 





以 有 的 高 度 也 至 少 是 4。 因 此 ，H 也 至 少 有 2 个 节点 。7 是 加 上 7 了， 可 能 还 有 更 多 节点 组 成 的 ， 
所 以 7 至 少 有 2 +2”= 2 个 节点 。 这 就 是 SC4+1)， 所 以 我 们 证 明了 归纳 步骤 。 

现在 就 知道 了 ,如 果 一 棵 树 有 nn 个 节点 且 高 度 为 h, 那么 肯定 有 n 三 2”。 如 果 在 两 边 取 对 数 ， 
就 得 到 log,n 三 h， 也 就 是 说 , 树 的 高 度 不 可 能 大 于 节点 数 的 对 数 。 这 样 一 来 ， 当 我 们 沿 着 任意 
路 径 从 节点 到 达 树 的 根 节点 时 ， 都 要 花 O (logn) 的 时 间 。 

现在 要 更 详细 地 描述 实现 这 些 想法 的 数据 结构 。 首 先 , 假设 用 NODE 类 型 来 表示 节点 。 就 像 
以 前 那样 ， 我们 假设 NODE 的 类 型 为 int， 而且 MAX 至 少 是 图 中 所 含 节点 的 数量 。 对 图 9-4 中 的 例 
子 而 言 ， 要 设 MAX 为 13。 

还 要 假设 由 EDGE 类 型 的 单元 组 成 的 链表 edqges ， 这 些 单元 是 由 如 下 声明 定义 的 

typedef struct EDGE *EDGELIST ; 

struct EDGE { 


NODE node1, node2; 
EDGELIST next; 














最 后 ， 对 图 中 的 每 个 节点 而 言 ， 还 需要 一 个 与 之 对 应 的 树 节 点 。 树 节点 是 TREENODE 类 型 
的 结构 体 ， 由 以 下 内 容 组 成 。 

(1) 父 指 针 ， 让 我 们 能 在 该 图 的 节点 上 构建 树 ， 并 沿 着 树 到 达 其 根 节 点 。 父 指针 为 NULL 就 
标识 该 节点 为 根 节 点 。 

(2) 以 给 定 节 点 为 根 节 点 的 树 的 高 度 。 只 有 该 节点 是 根 节 点 时 才 使 用 该 高 度 。 

此 可 以 将 TREENODE 类 型 定义 为 : 
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typedef struct TREENODE *TREE; 
struct TREENODE { 

int height ; 

TREE Parent ; 
}: 


我 们 还 要 定义 数组 

TREE nodes [MAX] ; 

以 便 将 每 个 图 节点 与 树 中 某 个 市 点 关联 起 来 。 应 当 明 白 ， 数 组 nodes 中 的 每 一 项 都 是 指 问 
树 中 节点 的 指针 ， 而 该 数据 项 也 是 图 中 节点 的 唯一 代表 。 

图 9-19 展 示 了 两 个 重要 的 辅助 函数 。 第 一 个 是 Eind， 它 接受 节点 a&， 取 指向 其 对 应 树 节 点 zx 
的 指针 ， 沿 着 x 的 父 指 针 及 其 祖先 加 上， 直到 到 达 根 节点 。 这 种 对 根 节 点 的 搜索 是 由 第 C2) 行 和 
第 (3) 行 执行 的 。 如 果 找 到 了 根 节 点 ， 就 会 在 第 (4) 行 返回 指 回 该 根 节 点 的 指针 。 请 注意 ,在 第 (]) 
行 ，NODE 类 型 一 定 是 int， 这 样 才能 用 它 来 作为 nodqes 数 组 的 索引 。 














/* 返回 树 的 根 节 点 位 置 ， 该 位 置 含 有 对 应 
图 节点 a 的 树 节 点 x */ 
TREE find(NODE a, TREE nodes[] ) ; 


TREE x; 
(1) x = nodes[al]; 
(2) while (x->parent != NULL) 
(3) x = x->parent; 
(4) return Xx; 
} 
/* 让 根 节点 较 低 的 树 成 为 根 节点 较 高 的 树 的 子 树 ， 
从 而 将 根 节点 分 别 
为 x 和 Y 的 树 合并 为 一 棵 树 */ 
void merge(TREE X，TREE y) 
{ 
TREE higher, lower; 
(5) if (x->height > y->height) { 
(6) higher = x; 
(7) lower = yj 
} 
else { 
(8) higher = y; 
(9) lower = xX; 
了 
(10) lower->parent = higher; 
(11) if (lower->height == higher->height) 
(12) ++(higher->height) ; 








图 9-19 ”辅助 函数 find 和 merge 


第 二 个 函数 是 merge,“ 它 接受 指向 两 个 树 节点 的 指针 x 和 y， 要 让 函数 正常 工作 ,它们 一 定 
是 需要 合并 的 两 棵 树 的 根 节 点 。 第 (5) 行 的 测试 确定 了 哪个 根 节 点 的 高 度 更 大 ， 如 果 相 等 就 直接 





J 不 要 把 该 函数 与 第 2? 章 和 第 3 章 中 用 于 归并 排序 的 同名 函数 弄 混 了 。 
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选择 y。 在 第 (6) 行 至 第 (7) 行 或 第 (8) 行 至 第 (9) 行 ， 会 根据 具体 的 情况 将 较 高 的 根 节 点 赋值 给 局 部 
变量 pigher ， 而 较 低 的 根 节 点 则 被 赋值 给 局 部 变量 lower。 接 着 在 第 (10) 行 较 低 的 根 节 点 会 成 
为 较 高 根 节点 的 子 节 点 ， 而 在 第 (10) 行 和 第 (12) 行 ， 如 果 九 和 素 的 高 度 相等 ， 较 高 根 节 点 〈《 也 就 
是 现在 合成 的 树 的 根 节 点 ) 的 高 度 要 增加 1。 较 低 根 节点 的 高 度 保持 不 变 , 不 过 现在 这 个 值 已 经 
没有 意义 了 ， 因 为 较 低 根 节 点 现在 已 经 不 再 是 根 节 点 了 。 

找 出 连通 分 支 的 算法 的 核心 内 容 如 图 9-20 所 示 。, 假 设 函 数 makeEdges () 会 把 手头 的 图 转换 
成 由 图 中 的 边 组 成 的 链表 ， 这 里 并 未 展示 该 函数 的 代码 。 








#include <stdio.h> 
#include <stdlib.h> 


#define MAX 13 
typedef int NODE; 
typedef struct EDGE *EDGELIST; 
struct EDGE { 
NODE nodel1, node2; 
EDGELIST next; 
}; 


typedef struct TREENODE *TREE; 
struct TREENODE { 

int height,; 

TREE parent; 
3; 


TREE find(NODE a, TREE nodes[]); 
void merge(TREE x, TREE y); 
EDGELIST makeEdges() ; 


main() 

{ 
NODE u; 
TREE a, b; 
EDGELIST e; 


TREE nodes [MAX] ; 


/* 初始 化 节点 ， 使 得 每 个 节点 都 在 由 其 自身 构成 的 树 中 */ 
1) for (u = 0; u < MAX; u++) 工 
2) nodes[u] = (TREE) malloc(sizeof (struct TREENODE) ) ; 
3) nodes [u] ->parent = NULL; 
4) nodes[u] ->height = 0; 
} 


/* 将 e 初 始 化 为 存放 图 中 各 边 的 表 */ 
(5) e = makeEdges() ; 


/* 检查 每 条 边 ， 如 果 边 的 的 端点 在 不 同 组 分 中 ， 就 将 它们 
全 并 大 
合 升 */ 


(6) while (e != NULL) { 

(7) a = find(e->nodel, nodes); 
(8) b = find(e->node2, nodes); 
(9) if (a != b) 

10) merge(a, b); 

11) 


e = e->next; 





图 9-20 用 来 找 出 连通 分 支 的 C 语 言 程序 
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用 来 找 出 连通 分 支 的 更 优 算法 
我 们 会 在 9.6 节 中 研究 深度 优先 搜索 时 看 到 ， 其 实 还 有 更 好 的 方法 来 计算 连通 分 支 ， 它 只 
需要 花费 O (m) 的 时 间 ， 而 不 是 O (m log nn) 的 时 间 。 不 过 ，9.4 节 中 给 出 的 数据 结构 本 身 也 很 实 
用 ， 我 们 在 9.5 节 中 就 要 看 到 另 一 个 使 用 该 数据 结构 的 程序 。 





图 9-20 的 第 (1) 行 到 第 (4) 行 会 浏览 数组 nodes， 而 在 第 (2) 行 会 为 每 个 节点 创建 一 个 树 节点 。 
在 第 (3) 行 其 parent 字 段 会 被 置 为 NULL ， 表 示 它 是 其 自身 构成 的 树 的 根 节 点 ， 而 在 第 (4) 行 会 将 
其 height 字 段 置 为 0， 以 反映 出 在 由 该 节点 自己 构成 的 树 中 就 只 有 它 这 一 个 点 。 

然后 第 (5) 行 会 把 e 初 始 化 为 指向 边 链表 中 的 第 一 条 边 ,而 且 第 (6) 行 到 第 (11) 行 的 循环 会 一 次 
检查 每 一 条 边 。 在 第 (7) 行 和 第 (8) 行 , 我 们 找到 了 当前 边 两 个 端点 的 根 节 点 。 接 着 在 第 (9) 行 要 测 
试 这 些 根 节 点 是 否 为 不 同 的 树 节 点 。 如 果 是 ， 那 么 当前 边 的 两 个 端点 在 不 同 分 文中 ， 而 且 我 们 
要 在 第 (10) 行 合并 这 些 分 文 。 如 果 该 边 的 两 个 端点 在 同一 分 文中 ,就 跳 过 第 (10) 行 ， 因 此 就 不 会 
对 树 集合 造成 任何 改变 。 最 后 ， 第 (11) 行 会 沉着 我 们 沿 着 边 链 表 行 进 。 
9.4.4 连通 分 支 算 法 的 运行 时 间 

我 们 来 确定 一 下 图 9-20 所 示 的 算法 处 理 一 幅 图 要 花 多 长 时 间 。 假 设 该 图 有 7 个 节点 ， 并 设 节 
点 数 和 边 数 的 较 大 者 为 m。 "首先 看 看 这 些 辅助 函数 。 我 们 论证 过 ， 将 高 度 较 低 的 树 合 并 到 高 度 
较 高 的 树 中 的 策略 可 以 保证 从 任意 树 节 点 到 达 其 根 节 点 的 路 径 都 不 会 比 log 长。 因此 ，find 
会 花费 O (log n) 的 时 间 。 

接 下 来 要 查看 图 9-19 中 的 函数 merge。 它 的 每 条 语句 都 花费 0 (1) 的 时 间 。 因 为 其 中 不 含 循 
环 或 孔 数 调用 ， 所 以 整个 函数 也 只 花 O (1) 的 时 间 。 

最 后 来 看 看 图 9-20 所 示 的 主 程序 。 第 (1) 行 到 第 (4) 行 的 for 循 环 循环 体 要 花费 O (1) 的 时 间 ， 
而 且 该 循环 要 迭代 n 次 。 因 此 ， 第 (1) 行 到 第 (4) 行 所 花 的 时 间 是 0 (n)。 假设 第 (5) 行 要 花费 0 (m) 
的 时 间 。 最 后 ， 考 虑 一 下 第 (6) 行 到 第 (11) 行 的 while 循 环 。 在 循环 体 中 ， 第 (7) 和 第 (8) 行 每 行 都 
要 花费 O(logn) 的 时 间 , 因为 它们 都 调用 了 了 据 数 fing, 而 我 们 刚刚 已 经 确定 过 findq 要 花费 O (log 
nn) 的 时 间 。 第 (9) 行 和 第 (11) 行 显然 只 要 0(1) 的 时 间 。 第 (10) 行 同样 只 要 O(1) 的 时 间 ， 因 为 我 们 刚 
刚 确 定 了 mezrge 人 花费 OU) 的 时 间 。 因 此 ， 整 个 循环 体 要 花费 O (log nn) 的 时 间 。 而 while 循 环 会 迭 
代 m 次 ， 其 中 是 边 的 数量 。 因 此 ， 该 循环 的 运行 时 间 就 是 O (m log n)， 也 就 是 迭代 的 次 数 乘 以 
循环 体 运 行 时 间 的 边界 。 

然后 ,一般 来 说 ， 整 个 程序 的 运行 时 间 可 以 表示 为 O(ntmtmlogn) 。 不 过 ，m 至 少 是 x， 所 
以 m log 7 这 一 项 就 主导 了 其 他 两 项 。 因 此 ， 图 9-20 所 示 程 序 的 运行 时 间 就 是 O (m log n)。 


9.4.5 “习题 


(1) 图 9-21 列 出 了 密歇根 州 的 一 些 城 市 以 及 它们 之 间 的 公路 里 程 数 。 就 本 习题 的 目的 而 言 可 以 忽略 里 
程 数 。 以 本 节 描 述 的 方式 检查 每 条 边 ， 构 建 该 图 的 连通 分 支 。 
(2)* 通过 对 j 的 归纳 证 明 ， 有 K 个 节点 的 连通 分 支 至 少 有 对 1 条 边 。 






































(GD 把 m 当 作 边 的 数量 是 很 正常 的 ， 不 过 在 某 些 图 中 ， 节 点 比 边 更 多 。 


384 第 9 章 图 数据 模型 





马凯 特 (Marquette ) 苏 圣 玛丽 ( Sault Ste. Marie ) 
萨 吉 诺 ( Saginaw ) 弗 林 特 (Flint ) 

大 急流 城 (Grand Rapids ) 兰 辛 ( Lansing ) 

底特律 (Detroit ) 兰 辛 ( Lansing ) 

埃 斯 卡 诺 巴 ( Escanaba ) 苏 圣 玛丽 ( Sault Ste. Marie ) 
安娜 保 (Ann Arbor ) 底特律 (Detroit ) 

















安娜 堡 (Ann Arbor ) 巴特 尔 克 里 克 ( Battle Creek ) 
巴特 尔 克 里 克 ( Battle Creek ) 卡拉 马祖 ( Kalamazoo ) 

梅 话 米 尼 ( Menominee ) 埃 斯 卡 诺 巴 ( Escanaba ) 
卡拉 马祖 (Kalamazoo ) 大 急流 城 (Grand Rapids ) 
埃 斯 卡 诺 巴 ( Escanaba ) 马凯 特 ( Marquette ) 
巴特 尔 克 里 克 ( Battle Creek ) 兰 辛 ( Lansing ) 

厚 林 特 (Flint ) 底特律 ( Detroit ) 





























图 9-21 ”密歇根 州 某 些 城市 间 的 距离 


(3) * 有 一 种 更 简单 的 方法 实现 “合并 ”和 “寻找 ”， 在 使 用 这 种 方法 时 ， 要 使 用 以 节点 为 索引 的 数 

组 ， 给 出 每 个 节点 的 分 文 。 一 开始 ， 每 个 节点 都 在 由 它 自 己 构 成 的 分 文中 ， 而 且 我 们 要 用 相应 的 

节点 来 为 这 种 分 支 命 名 。 要 找到 节点 的 分 支 ， 只 要 查找 对 应 的 数组 项 即 可 。 要 合并 分 支 ， 就 要 沿 

数组 向 下 行进 ， 将 所 有 出 现 第 一 个 分 文 的 地 方 都 改 为 第 二 个 分 文 。 

(a) 编写 C 语 言 程序 实现 这 一 算法 。 

(b) 该 程序 的 运行 时 间 是 多 少 ? 将 其 表示 为 节点 数 n 与 节点 数 和 边 数 较 大 值 m 的 函数 。 

(c) 对 某 些 边 数 和 节点 数 而 言 ， 这 种 实现 其 实 比 本 章 中 描述 的 实现 还 要 好 。 什 么 时 候 这 种 实现 
更 好 ? 

* 假设 本 节 的 连通 分 支 算法 中 不 是 将 较 低 的 树 合并 到 较 高 的 树 中 ， 而 是 将 节点 较 少 的 树 合并 到 节 

点 较 多 的 树 中 。 这 种 连通 分 支 算法 的 运行 时 间 是 否 仍 为 O (m log n)? 


9.5 最 小 生成 树 


连通 分 文 问题 有 个 很 重要 的 推广 , 其 中 给 定 了 以 数字 (整数 或 实数 ) 作为 边 标号 的 无 向 图 。 
我 们 不 仅 要 找到 连通 分 支 ， 而 且 要 为 各 分 支 找到 连接 分 文中 各 节点 的 树 。 此 外 ， 该 树 一 定 是 最 
小 的 ， 意 味 着 边 标 号 的 和 是 尽 可 能 小 的 。 

这 里 讨论 的 树 与 第 5 章 讨论 过 的 树 不 太一 样 。 这 里 的 树 中 没有 节点 会 被 指定 为 根 节 点 , 而且 
没有 子 节 点 或 子 节点 次 序 的 概念 。 丁 中 提 到 “ 树 ” 时 ， 指 的 是 没有 根 没 有 次 序 的 树 ， 就 是 那 
些 不 会 简单 环 路 的 无 向 图 。 

无 向 图 G 的 生成 树 是 由 G 的 节点 与 G 的 边 的 子 集 按照 如 下 要 求 一 起 构成 的 。 

(1) 连通 节点 ， 也 就 是 说 ,任意 两 个 市 点 之 间 都 存在 只 用 生成 树 中 的 边 构成 的 路 径 。 

(2) 形成 无 根 且 无 次 序 的 树 ， 也 就 是 说 ， 树 中 没有 (简单 ) 环 路 。 

如 有 果 G 是 单个 连通 分 支 ， 就 总 是 存在 生成 树 。 最 小 生成 树 是 给 定 图 对 应 的 任意 生成 树 中 边 
标号 的 和 最 小 的 那个 。 
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+ 示例 9.16 
设 图 G 是 如 图 9-4 或 图 9-10 所 示 对 应 瓦 胡 岛 的 连通 分 支 。 图 9-22 展 示 了 一 种 可 能 的 生成 树 。 


它 是 通过 删除 { 迈 里 ， 瓦 西 阿 瓦 } 和 { 卡 内 奥 赫 ,， 拉 慎 } 这 两 条 边 并 剩 下 其 余 5 条 边 形 成 的 。 这 棵 树 
的 权 ( 也 就 是 边 标 写 之 和 ) 为 84。 正 如 我 们 将 要 看 到 的 ， 这 不 是 最 小 值 。 


28 
全 瓦 西 阿 瓦 卡 内 奥 赫 


13 











珍珠 城 


图 9-22 ”对 应 瓦 胡 岛 的 生成 树 





有 根 树 与 无 根 树 


无 根 树 的 概念 似乎 不 应 该 很 奇怪 。 其 实 我 们 可 以 从 无 根 树 中 任 选 一 个 节点 作为 根 节点 。 这 
样 就 为 所 有 的 边 给 出 了 远离 根 节 点 ， 或 者 是 从 父 节 点 到 子 节点 的 方向 。 从 物理 意义 上 讲 ， 这 就 
点 提起 该 树 ， 让 该 树 其 他 部 分 从 选 定 的 节点 处 吊 起 来 。 例 如 ， 可 以 将 珍 


像 是 从 无 根 树 的 某 个 节 
珠 城 作为 图 9-22 所 示 生 成 树 的 根 节 点 ， 它 就 成 了 下 面 这 样 
珍珠 城 
迈 里 瓦 西 阿 瓦 檀香山 
拉 耶 卡 内 奥 赫 


如 果 愿 意 的 话 ， 可 以 为 每 个 节点 的 子 节 点 排 定 次 序 , 不 过 这 种 次 序 是 任意 的 ,与 原来 的 无 
根 树 之 间 没 有 关系 。 





9.5.1 找到 最 小 生成 树 
有 多 种 用 于 找到 最 小 生成 树 的 算法 。 我们 将 研究 其 中 一 种 ,名 为 克 曾 斯 卡尔 算法 (Kruskals 
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algorithm )， 它 是 对 9.4 节 中 讨论 过 的 寻找 连通 分 文 算法 的 一 种 简单 扩展 。 需 要 进行 的 修改 如 下 
所 述 。 

(1) 需要 按照 边 标号 的 递增 次 序 考 虑 这 些 边 。 我 们 在 示例 9.14 中 刚好 选择 了 这 种 次 序 ， 不 过 
对 连通 分 文 而 言 这 不 是 必要 的 。 

(2) 在 考虑 边 时 ， 如 果 边 的 两 个 端点 在 不 同 分 文中 ， 就 要 选择 该 边 构成 生成 树 并 且 合 并 
两 个 分 文 ,正如 9.4 节 的 算法 中 所 做 的 。 和 否则 ， 就 不 选择 这 条 边 构 成 生成 树 ， 当 然 也 就 不 用 合 
J 


+ 示例 9.17 

Acme Surfboard Wax 公司 在 如 图 9-4 所 示 的 13 个 城市 中 都 有 办 公 地 点 。 它 希望 从 电话 公司 
租用 专用 的 数据 传输 线路 ， 我 们 假设 电话 线路 是 沿 着 图 9-4 中 的 边 表示 的 公路 架设 的 。 在 不 同 
的 马上 屿 之 间 ， 该 公司 必须 使 用 卫星 传输 ， 而 成 本 与 分 支 数 量 是 成 正比 的 。 不 过 ， 对 地 面 传输 线 
路 来 说 ， 电 话 公司 是 按 里 程 收费 的 。" 因 此 ， 我们 希望 为 图 9-4 所 示 的 图 中 各 连通 分 支 找 出 最 小 
生成 树 。 

如 果 按 照 分 支 分 开 这 些 边 ， 就 可 以 分 别 为 各 分 文 运行 克 鲁 斯 卡尔 算法 。 不 过 ， 如 果 我 们 尚 
不 知道 有 哪些 分 支 ， 就 必须 将 所 有 的 边 放 在 一 起 考虑 ， 从 最 小 的 标号 开始 ， 按 照 图 9-14 的 次 序 
进行 。 正 如 9.4 节 中 那样 ， 我 们 先 从 由 节点 本 身 构成 的 分 文中 的 各 节点 开始 。 

首先 考虑 标号 最 小 边 { 卡 内 奥 赫 ， 模 香山 }。 这 条 边 将 这 两 个 城市 合并 到 一 个 分 文中 ， 而 且 
因为 我 们 执行 了 合并 操作 ， 所 以 就 选择 了 该 边 用 来 构成 最 小 生成 树 。2 号 边 是 { 瓦 西 阿 拟 ， 珍 珠 
城 }, 而 且 因为 这 条 边 也 是 合并 了 两 个 分 文 , 所 以 它 也 被 选 来 构成 该 生成 树 。 同样 , 第 三 条 边 { 珍 
珠 城 ， 模 香山 } 和 第 四 条 边 { 瓦 西 阿 拟 ， 迈 里 } 也 合并 了 分 文 ， 因 此 也 被 放 和 生成 树 。 

第 五 条 边 { 卡 胡 卢 全 ， 凯 奥 凯 阿 } 合 并 了 这 两 个 城市 ， 而 且 也 被 接纳 到 生成 树 中 ， 虽 然 这 
条 边 是 要 成 为 表示 毛 伊 咏 分 文 的 生成 树 的 一 部 分 ， 而 不 是 和 前 四 条 边 那 样 是 瓦 胡 咏 分 六 的 一 
部 分 。 

第 六 条 边 { 迈 里 ， 珍 珠 城 } 连 接着 已 经 出 现在 同一 分 支 中 的 两 个 城市 。 因 此 ， 该 边 会 被 生成 
树 拒 之 门 外 。 即 便 我 们 必须 选择 某 条 标号 更 大 的 边 ， 也 不 能 选择 { 迈 里 ， 珍 珠 城 } ， 因 为 这 样 一 
来 就 会 在 迈 里 、 瓦 西 阿 所 和 珍珠 城 间 形成 一 条 环 路 。 在 生成 树 中 是 不 可 以 有 环 路 的 ， 所 以 这 3 
条 边 中 必须 有 一 条 被 排除 在 外 。 随 着 我 们 按照 标号 的 次 序 考 虑 这 些 边 ， 最 后 的 边 肯 定 有 着 最 大 
的 标号 ， 也 是 最 佳 方案 要 排除 掉 的 。 

第 七 条 边 { 拉 海 纳 ， 卡 胡 户 伊 } 和 第 八条 边 { 拉 耶 ， 卡 内 奥 赫 } 都 被 生成 树 接纳 ， 因 为 它们 合 
并 了 分 支 。 而 9 号 边 { 拉 耶 ， 瓦 西 阿 瓦 } 会 因为 它 的 端点 在 同一 分 支 中 而 不 被 接受 。 我 们 会 接受 10 
号 边 和 11 号 边 ， 它 们 形成 了 表示 “大 遇 ” 分 支 的 生成 树 ， 而 且 我 们 会 接纳 12 号 边 以 完成 毛 伊 咏 
分 文 。13 号 边 不 会 被 接纳 ， 因 为 它 连 接 的 科 纳 和 乔治 已 经 被 10 号 边 和 11 号 边 连接 到 同一 分 文中 
了 。 得 到 各 分 支 的 生成 树 如 图 9-23 所 示 。 
































J 这 是 一 种 为 租用 的 电话 线路 收费 的 可 行 方式 。 人 们 可 以 找 出 连接 这 些 所 需 场所 的 最 小 生成 树 ， 且 收费 是 根据 该 
树 的 权 得 出 的 ， 而 不 用 考虑 提供 电话 连接 的 实际 方式 。 





9.5 最 小 生成 树 387 


卡 胡 卢 伊 








图 9-23 ”图 9-4 所 示 的 图 对 应 的 生成 树 


9.5.2” 克 鲁 斯 卡尔 算法 起 效 的 原因 


可 以 证 明 ， 克 和 鲁 斯 卡尔 算法 可 为 某 给 定 图 生成 权 最 小 的 生成 树 。 设 G 是 无 向 连通 图 。 简 便 
起 见 ， 如 果 需 要 ， 我 们 会 为 某 些 标 号 加 上 一 些 极 小 的 量 ， 使 得 所 有 标号 都 是 不 同 的 ， 而 且 添 加 
的 各 极 小 量 的 和 要 小 于 G 中 任意 不 同 标 号 之 间 的 差 。 这 样 一 来 , 带 有 新 标号 的 G 就 会 有 唯一 的 最 
小 生成 树 ， 它 将 会 是 带 原 有 权 的 G 所 有 最 小 生成 树 中 的 一 棵 。 

接着 ， 设 e1、e，、…、en 是 G 的 所 有 边 ， 而 且 是 按照 标号 从 小 到 大 的 顺序 排列 的 。 请 注意 ， 
这 个 次 序 也 是 克 鲁 斯 卡尔 算法 处 理 这 些 边 依照 的 次 序 。 设 K 是 带 有 用 克 和 鲁 斯 卡尔 算法 生成 的 调 
整 后 标号 的 图 G 对 应 的 生成 树 ， 并 设 7 是 G 唯 一 的 最 小 生成 树 。 

我 们 要 证 明 K 和 7 其 实 是 相同 的 。 如 果 它 们 是 不 同 的 ,一 定 至 少 存 在 一 条 边 在 其 中 一 棵 树 而 
不 在 男 一 棵 中 。 设 e: 是 这 一 系列 边 中 第 一 条 这 样 的 边 ， 也 就 是 说 ，e1、…、ei 1 要 人 么 同 在 K 和 7 中 ， 
要 么 都 不 在 K 和 7 中 。 这 里 有 两 种 情况 ， 取 决 于 e 是 在 K 中 还 是 在 7 中 。 我 们 在 每 种 情况 下 都 能 得 
出 矛盾 ， 因 此 就 能 得 出 e: 是 不 存在 的 ， 因 此 K= 7， 而 且 K 是 G 的 最 小 生成 树 。 





























贪 禁 有 时 是 有 用 的 
克 重 斯 卡尔 算法 是 贪 焚 算 法 的 一 个 好 例子 ,在 贪 禁 算 法 中 我 们 会 做 出 一 系列 的 决定 ,每 次 
都 做 出 当时 最 佳 的 选择 。 这 些 局 部 的 决定 是 决定 哪 条 边 要 被 添加 到 正在 成 形 的 生成 树 中 。 在 各 
情况 下 , 我们 都 要 选择 那 条 标号 最 小 但 又 不 会 因为 产生 环 路 而 破坏 “生成 树 ” 定 义 的 边 。 通 常 ， 
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局 部 最 优选 择 的 整体 效果 不 是 全 局 上 最 适合 的 。 然 而 ,在 克 鲁 斯 卡尔 算法 的 情况 中 ,可 以 证 明 
结果 从 全 局 上 讲 也 是 最 佳 的 ， 也 就 是 一 棵 权 最 小 的 生成 树 。 





情况 1。 边 e 在 7 中 而 不 在 KE 中 。 如 果 克 鲁 斯 卡尔 算法 不 接受 e,， 那么 e: 肯 定 与 之 前 为 K 选 择 的 
边 中 某 路 径 P 形 成 了 环 路 ， 如 图 9-24 所 示 。 因 此 ， 组 成 P 的 边 都 能 在 e:/、…、ei; 中 找到 。 不 过 ， 
T 和 K 对 这 些 边 是 一 致 的 ， 也 就 是 说 ， 如 果 P 的 边 在 Kk 中， 那么 这 些 边 也 在 7 中 。 不 过 因为 7 中 合 
有 e，P 加 上 e 就 在 7 中 形成 了 环 路 ， 这 与 我 们 说 7 是 生成 树 的 假设 是 矛盾 的 。 因 此 ，e 在 7 中 而 不 
在 K 中 是 不 可 能 的 。 


图 9-24 路径 P( 实 线 ) 在 TA 和 IK 中 ， 边 ej; 只 在 7 中 


情况 2。 边 e 在 K 中 而 不 在 7 中 。 设 e 连 接 了 节点 zx 和 v。 因 为 7 是 连通 的 ， 所 以 在 7 中 节点 zi 和 ly 
之 间 一 定 存在 某 条 无 环 路 径 ， 假 设 称 其 为 2。 因 为 2 没有 用 到 边 e， 所 以 2 加 上 e 在 图 C 中 形成 了 
简单 环 路 。 这 里 存在 两 种 子 情况 ， 具 体 取决 于 e 的 标号 是 否 比 路 径 C 上 所 有 边 的 标号 都 大 。 

(a) 边 ey 有 着 最 高 的 标号 。 那 么 O 上 的 所 有 边 都 在 {fe1，…，ei 4} 中 。 请 记 住 ，T 和 K 在 ej 之 前 
的 所 有 边 都 是 一 样 的 ， 所 以 CO 中 所 有 的 边 也 是 K 中 的 边 。 不 过 e 也 在 KE 中， 这 表示 天 是 一 条 环 路 。 
因此 我 们 排除 了 e 的 标号 比 0 中 任何 边 的 标号 都 高 的 可 能 。 

(b) 路 径 O 上 的 某 边 的 标号 比 ej 的 标号 高 。 假 设 / 连 接 节 点 w 和 x。 图 9-25 展 示 了 树 7 中 的 这 
种 情况 。 如 果 将 边 /从 7 中 删除 , 并 加 上 边 e;, 就 不 会 形成 环 路 ,因为 路 径 O 因 f/ 被 删除 而 中 断 了 。 
得 到 的 边 的 集合 权 要 比 7 低 ， 因 为 /有 着 比 e 更 高 的 标号 。 我 们 声明 得 到 的 这 些 边 仍然 连通 所 有 
节点 。 要 知道 原因 ， 请 注意 mw 和 zx 仍 然 是 连通 的 ， 有 一 条 路 径 沿 着 O 从 w 到 wx， 然后 沿 着 边 e， 然 
后 再 沿 着 路 径 O 从 * 到 x。 因 为 fw,， 寻 是 唯一 一 条 被 删除 的 边 ， 如 果 它 的 终点 仍然 是 连通 的 , 那 
么 显然 所 有 节点 都 是 连通 的 。 因 此 , 边 的 新 集合 是 生成 树 ， 而 它 的 存在 与 7 是 最 小 生成 树 的 假 
设 相 矛盾 。 

现在 就 已 经 证 明了 e; 不 可 能 在 K 中 而 不 在 7 中 。 这 样 就 排除 了 第 二 种 情况 。 因 为 e: 不 可 能 在 7 
和 KK 中 ， 所 以 可 以 得 出 结论 ，K 其 实 就 是 最 小 生成 树 T7。 也 就 是 说 ， 克 和 鲁 斯 卡尔 算法 总 是 能 找到 
最 小 生成 树 。 
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图 9-25 ”路 径 O ( 实 线 ) 在 7 中 ， 我 们 可 以 将 边 e 添 加 到 7 中 并 删除 边 / 


9.5.3” 克 鲁 斯 卡尔 算法 的 运行 时 间 


假设 对 某 一 含 n 个 节点 的 图 运行 克 鲁 斯 卡尔 算法 。 就 像 9.4 节 那样 , 设 m 是 节点 数 与 边 数 的 较 
大 者 , 但 请 记 住 ,通常 边 数 是 较 大 者 。 假 设 该 图 是 用 邻接 表 表 示 的 ， 这样 就 可 以 在 O (m) 的 时 间 
内 找到 所 有 的 边 。 

首先 , 必须 用 标号 为 边 排序 , 如 果 使 用 了 诸如 归并 排序 这 样 的 高 效 排序 算法 , 就 要 花 上 0O (m 
log m) 的 时 间 。 接 着 要 考虑 这 些 边 ， 花 上 O (m log n) 的 时 间 进 行 所 有 的 合并 与 寻找 ， 就 像 在 9.4 
方 中 讨 论 过 的 那样 。 因 此 看 起 来 元 鲁 斯 卡尔 算法 的 总 运行 时 间 是 O (m (log n+log m))。 

不 过 ， 要 注意 到 m 三 n>* ， 因 为 只 存在 n(n 一 1)/2 个 节点 对 。 因 此 ，logm 三 21logn ， 这 样 一 
来 m(logn+logm) 三 3mlogn 。 因 为 在 大 O 表 达 式 中 常数 因子 是 可 以 省 略 掉 的 ， 所 以 可 以 得 出 结 
论 : 克 和 鲁 斯 卡尔 算法 的 运行 时 间 是 0 (m log n)。 


9.5.4 “习题 


(1) 如 果 瓦 西 阿 瓦 被 选 为 根 节 点 ， 夯 出 表示 图 9-22 的 树 。 
(2) 使 用 克 和 鲁 斯 卡尔 算法 为 边 和 标号 都 如 图 9-21 ( 见 9.4 节 习题 ) 所 示 的 各 分 支 找到 最 小 生成 树 。 
(3) ** 证 明 ， 如 果 图 G 是 有 n 个 节点 的 无 问 连通 图 ， 而且 7 是 G 的 生成 树 ， 则 TH 有 n-1 条 边 。 提 示 : 我 们 











点 Ye。 考虑 如 果 对 每 个 点 xz 都 至少 有 两 条 7 的 边 含有 会 发 生 什 么 。 沿 着 边 进 出 一 系列 的 节点 ， 最 
终 会 找到 一 条 环 路 。 因 为 假设 7 是 生成 树 ， 所 以 它 不 可 能 含有 环 路 ， 这 样 一 来 就 形成 蔬 盾 了 。 
(4)* 一 旦 我 们 选 定 了 n-1 条 边 ， 就 不 需要 考虑 将 更 多 的 边 纳入 该 生成 树 了。 描述 克 鲁 斯 卡尔 算法 的 一 
个 变种 ， 它 不 会 为 所 有 边 排序 ， 但 会 将 它们 放 入 优先 级 队列 中 ， 将 边 标 号 的 相反 数 作为 其 优先 级 
( 也 就 是 最 短 的 边 会 首先 被 4eleteMax 选 中 ) 。 证 明 ， 如 果 生 成 树 可 以 在 前 m/log m 条 边 中 找到 ， 那 
么 这 一 版 本 的 克 鲁 斯 卡尔 算法 就 只 需要 花 O (m) 的 时 间 。 

(5)* 假设 为 图 G 找 到 了 最 小 生成 树 7， 然 后 向 G 添 加 权 为 w 的 边 {u，v}。 在 什么 情况 下 7 仍 是 新 图 的 最 
小 生成 树 ? 

(6) ** 无 向 图 G 的 欧 拉 回路 是 起 止 点 为 同一 节点 而 且 刚好 含有 图 G 中 每 条 边 一 次 的 路 径 。 
(a) 证 明 ， 当 且 仅 当 每 个 节点 都 为 偶数 度 时 ， 无 向 连通 图 含有 欧 拉 回路 。 
(b) 设 G 是 有 m 条 边 而 且 每 个 节点 都 为 偶数 度 的 无 向 图 。 给 出 运行 时 间 是 0 (m) 的 为 图 G 构 建 欧 拉 回 

路 的 算法 。 
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9.6 ”深度 优先 搜索 


我 们 现在 要 描述 一 种 对 有 向 图 而 言 很 实用 的 图 探索 方法 。 在 5.4 广 中 我 们 讨论 过 树 的 前 序 遍 
历 和 后 序 壳 历 ， 其 中 从 根 节点 开始 ， 弟 归 地 探索 了 访问 过 的 每 个 节点 的 子 节 点 。 我 们 几乎 可 以 
将 同样 的 思路 应 用 到 任意 有 向 图 上 。 "从 任意 节点 出 发 ， 可 以 递归 地 探索 其 后 继 。 

不 过 ， 必 须 小 心 图 中 存在 环 路 的 情况 。 如 果 存 在 环 路 ， 我 们 可 能 会 绕 着 环 路 永远 地 递归 调 
用 探索 函数 。 例 如 ， 考 虑 图 9-26 中 的 图 。 从 节点 a 开始 ,我们 可 能 决定 接 下 来 探索 节点 5。 从 5 出 
发 可 能 会 完 探索 ec， 然后 从 c 出 发 可 能 要 先 探索 pb。 这 样 就 会 导致 无 限 递 归 ， 反复 地 探索 bp 和 c。 其 
实 ， 我 们 选择 按照 什么 次 序 探索 bp 和 c 的 后 继 是 不 重要 的 。 要 么 会 困 在 其 他 的 环 路 中 ， 要 么 最 终 


会 无 限 地 从 5 探索 ce 并 从 c 探 索 b。 


























图 9-26 有 向 图 的 示例 

这 一 问题 有 个 简单 的 解决 方案 : 在 访问 节点 的 过 程 中 为 其 做 上 标记 ， 并 永 不 再 次 访问 标记 
过 的 节点 。 这 样 一 来 ， 我 们 从 起 始 节点 起 可 以 到 达 的 任何 节点 都 会 被 探索 到 ， 而 之 前 已 经 访问 
的 节点 不 会 被 再 次 访问 。 我 们 将 看 到 这 种 探索 所 花 的 时 间 是 与 被 探索 的 弧 的 数量 成 比例 的 。 

这 种 搜索 算法 叫 作 深度 优先 搜索 ， 因 为 我 们 会 尽 可 能 快 地 行进 到 离 初始 节点 尽 可 能 远 ( 尽 
可 能 “ 深 ”) 的 节点 。 这 可 以 通过 一 种 简单 的 数据 结构 实现 。 这 里 要 再 次 假设 使 用 NODE 类 型 为 
节点 命名 ,而 且 该 类 型 就 是 int 类 型 。 我 们 用 邻接 表 表 示 弧 。 因 为 需要 为 每 个 节点 添加 一 个 “ 标 
记 ”， 其 值 是 从 VISITED 和 UNVISITED 中 二 选 一 ， 所 以 要 创建 一 个 结构 体 数组 来 表示 该 图 。 这 
些 结构 体 要 同时 包括 这 里 所 说 的 标记 以 及 邻接 表 的 表 头 。 

enum MARKTYPE {VISITED, UNVISITED}:; 

typedef struct { 

enum MARKTYPE mark; 


LIST successors; 
} GRAPH [MAX]; 
其 中 LIST 为 邻接 表 ， 是 按照 以 下 习惯 方式 定义 的 
typedef struct CELL *LIST; 
struct CELL { 
NODE nodeName; 
LIST next; 
由 




















J 请 注意 ， 如 果 将 树 中 的 弧 看 作 存 在 从 父 节 点 到 子 节点 的 方向 ， 树 就 可 以 被 当 作 有 向 图 的 一 个 特例 。 其 实 ， 树 还 
总 是 无 环 图 。 
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一 开始 要 将 所 有 的 市 点 标记 为 UINVISITED。 图 9-27 所 示 的 递归 函数 dfs (u,G) 会 处 理 某 幅 
在 外 部 定义 的 GRAPH 类 型 的 图 G 中 的 节点 u。 

在 第 (1) 行 我 们 将 u 标 记 为 VISITED， 这 样 就 不 用 再 次 对 它 调用 dfs 了 。 第 (2) 行 会 初始 化 指 
针 p， 它 指向 节点 wu 的 邻接 表 的 第 一 个 单元 。 第 (3) 行 至 第 0) 行 的 循环 会 带 p 沿 着 邻接 表 向 下 行进 ， 
依次 考虑 u 的 各 后 继 v。 





void dfs(NODE u, GRAPH G) 


{ 2 、 二 地 
LIST p: /* 沿 着 u 对 应 的 邻接 表 下 行 */ 


NODE 0 


G[Lu] .mark = VISITED; 
p = G[u] .successors; 
while (P != NULL) 荆 
V = p->nodeName; 
if (G[v] .mark == UNVISITED) 
dfs(v, G); 
p= p->next; 


eT 
ONO 
i i i A 








图 9-27 递归 的 深度 优先 搜索 函数 

第 (4) 行 会 将 v 置 为 节点 a“ 当前 ”的 后 继 。 在 第 (5) 行 ， 我 们 会 测试 v 之 前 是 否 已 经 被 访问 过 。 
如 果 是 ， 就 跳 过 第 (6) 行 的 递归 调用 并 在 第 (7) 行 中 将 p 移 动 到 邻接 表 的 下 一 个 单元 。 不 过 ， 如 果 v 
从 未 被 访问 过 , 就 要 在 第 (6) 行 从 节点 v 开 始 进行 深度 优先 搜索 。 最 后 , 完成 对 afs (v,G) 的 调用 。 
然后 执行 第 (7) 行 ，i 上 p 沿 着 u 的 邻接 表 疝 下 移动 并 进行 循环 。 
+ 示例 9.18 

假设 G 是 图 9-26 所 示 的 图 , 而 且 为 了 简化 问题 , 假设 各 邻接 表 中 的 节点 都 是 按照 字母 表 顺 序 
排列 的 。 一 开始 ， 所 有 节点 都 会 被 标记 上 UNVISITED。 调 用 afs (a) ，" 节 点 a 在 第 (1) 行 会 被 标 
记 为 VISITED， 而 且 我 们 在 第 (2) 行 要 初始 化 指针 p， 它 指向 的 邻接 表 的 第 一 个 单元 。 在 第 (4) 
行 v 被 置 为 ?， 因 为 bp 是 第 一 个 单元 中 的 节点 。 由 于 5b 当前 处 于 未 被 访问 的 状态 ， 所 以 第 (5) 行 的 测 
试 会 成 功 ， 并 且 要 在 第 (6) 行 调用 dfs (b) 。 

现在 ， 要 以 bp 为 参数 开始 一 次 对 dfs 的 新 调用 ， 而 w= a 的 旧 调 用 处 于 休眠 状态 而 并 未 终止 。 
因为 c 是 bp 的 邻接 表 中 的 第 一 个 节点 ， 所 以 在 第 (4) 行 成 了 v 的 值 。 节 点 c 是 未 访问 过 的 ， 所 以 我 们 
在 第 (5) 行 会 成 功 并 在 第 (6) 行 调用 dfs (c) 。 

现在 激活 了 对 dfs 的 第 三 次 调用 ， 而 且 要 开始 dfs (c) ,我 们 将 cd 标 记 为 VISITED， 并 在 第 (4) 行 
将 v 置 为 ?， 因 为 5 是 c 的 邻接 表 中 第 一 个 也 是 唯一 的 一 个 节点 。 不 过 ，P 已 经 在 对 dfs (b) 的 调用 的 第 
(1) 行 中 被 标记 为 VISITED 了 ， 所 以 我 们 要 跳 过 第 (6) 行 , 并 在 第 (7) 行将 p 沿 着 c 的 邻接 表 问 下 移动 。 
为 c 没 有 更 多 后 继 了 , 这样 p 就 成 了 NULL， 所 以 第 G3) 行 的 测试 就 会 失败 , 对 dfs (c) 的 调用 就 完成 了 。 

现在 又 回 到 对 dfs (b) 的 调用 。 指 针 p 在 第 (7) 行 被 前 移 ， 现 在 它 指向 bp 的 邻接 表 的 第 二 个 单 
元 ， 这 个 单元 存放 着 节点 4。 我 们 在 第 (4) 行 将 v 置 为 4， 因 为 4 是 未 被 访问 过 的 ， 所 以 在 第 (6) 行 要 
调用 dfs (d)。 

在 执行 dfs (qd) 时 ,我们 会 将 4 标记 为 VISITED。 那 么 vy 首先 会 被 置 为 c。 但 因为 c 是 被 访问 过 的 ， 





























中 在 接 下 来 的 内 容 中 ， 我 们 将 省 略 dfs 的 第 二 个 参数 ， 因 为 它 永 远 都 是 图 G。 
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因此 下 一 次 进行 循环 时 会 有 v=e。 这 会 引发 对 dfs (e) 的 调用 。 节 点 e 只 有 c 这 么 一 个 后 继 ， 所 以 在 将 
e 标 记 为 VISITED 后 ，dfs (e) 就 会 返回 到 dfs (9) 。 接 下 来 在 afs (d) 的 第 (4 行进 行 v= /的 赋值 ， 并 
调用 afs (f) 。 在 把 钙 记 为 VISITED 后 ， 我 们 会 发 现 了 由 只 有 c 这 么 一 个 后 继 ， 而 c 又 是 被 访问 过 的 。 

现在 就 完成 了 对 dfs (f) 的 调用 。 因为 是 4 的 最 后 一 个 后 继 , 所 以 我 们 完成 了 对 afs (d) 的 调用 ， 
而 且 由 于 4 是 b 的 最 后 一 个 后 继 ， 这 样 也 就 完成 了 对 dfs (b) 的 调用 。 这 样 就 把 我 们 带 回 了 dfs (a) 。 
节点 a 还 有 男 一 个 后 继 4， 不 过 该 节点 是 被 访问 过 的 ， 所 以 我 们 也 就 完成 了 对 dfs (a) 的 调用 。 

图 9-28 总 结 了 dfs 对 图 9-26 所 示 图 的 操作 。 我 们 展示 了 对 dfs 进 行 调用 的 情况 ,并 在 右 侧 给 
出 了 当前 处 于 活跃 状态 的 调用 。 我 们 还 表示 了 每 一 步 执行 的 活动 ， 并 展示 了 与 当前 活跃 的 调用 
相关 联 的 局 部 变量 v 的 值 ， 或 者 是 给 出 pb = NULL， 表 示 没 有 相应 的 v 值 。 



































dfs(a) 调用 dfs(b) 

Vb 

dfs(a) dfs(b) 调用 dfs (c) 

和 全 四 We 

dfs(a) dfs(b) dfs(c) 跳 过 ，b 已 经 被 访问 过 
v=b VE v=0b 

dfs(a) dfs(b) dfs(c) 返回 

v=b VG p =NULL 

dfs(a) dfs(b) 调用 dfs (qd) 

v=b v=d 

dfs(a) dfs(b) dfs(d) 跳 过 ，c 已 经 被 访问 过 
沁 三 0 SQ Y= 

dfs(a) dfs(b) dfs(d) 调用 dfs (e) 

v=b v=d v= 二 € 

dfs(a) dfs(b) dfs(d) dfs(e) 跳 过 ，c 已 经 被 访问 过 
人 三 二 vd Y=€ cs 

dfs(a) dfs(b) dfs(d) dfs(e) 返回 

v=0b 2 v=e€ D =NULL 

dfs(a) dfs(b) dfs(d) 调用 dfs (f£) 

QE wd = 

dfs(a) dfs(b) dfs(d) dfs(f) 跳 过 ，c 已 经 被 访问 过 
v=b vd VE 1 

dfs(a) dfs(b) dfs(d) dfs(f) 返回 

v=0b v=d ts D =NULL 

dfs(a) dfs(b) dfs(d) 返回 

V6 六 三.Q p =NULL 

dfs(a) dfs(b) 返回 

不 全 4 2 =NULL 

dfs(a) 跳 过 ，d 已 经 被 访问 过 
几 三 以 

dfs(a) 返回 

Dp =NULL 








图 9-28 ”在 深度 优先 搜索 期 间 所 执行 调用 的 记录 
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9.6.1 构建 深度 优先 搜索 树 


因为 我 们 标记 了 市 点 以 防 访 问 它们 两 次 ， 这 样 一 来 在 探索 图 的 过 程 中 图 就 像 树 那样 了 。 其 
实 ， 也 可 以 绘 出 一 棵 树 ， 其 父子 市 点 之 间 的 边 就 是 被 搜索 的 图 G 中 的 某 些 弧 。 如 果 我 们 在 对 
dfs (u) 的 调用 中 ， 而 且 它 会 带 来 对 dfs (v) 的 调用 ， 那 么 我 们 就 让 v 成 为 wx 在 该 树 中 的 子 节 点 。 
4 的 子 节 点 是 按照 对 这 些 子 市 点 调用 dh 的 次 序 从 左 癌 右 出现 的 。 而 第 一 次 df 调用 所 针对 的 节点 
就 是 该 树 的 根 节 点 。 不 会 对 任何 节点 调用 dt 两 次 ， 因 为 在 第 一 次 调用 后 这 些 节 点 就 会 被 标记 为 
VISITED。 因 此 ， 这 样 定义 的 结构 真是 棵 树 。 我 们 可 以 称 这 样 的 树 是 某 给 定 图 的 深度 优先 搜索 
树 (depth-first search tree )。 





+ 示例 9.19 

图 9-29 所 示 的 树 展示 了 图 9-28 总 结 的 对 图 9-26 所 示 的 图 的 探索 过 程 ,我 们 把 代表 父子 关系 的 
树 向 弧 (tree arc ) 表示 为 实 线 ， 图 中 的 其 他 弧 被 表示 为 虚线 箭头 。 这 里 我 们 应 该 忽略 节点 标号 
的 数字 。 








图 9-29 ”图 9-26 所 示 的 图 的 一 种 可 能 的 深度 优先 搜索 树 


9.6.2 ”深度 优先 搜索 树 弧 的 分 类 


当 我 们 为 图 G 构 建 深度 优先 搜索 树 时 ， 可 以 把 G 中 的 弧 分 为 4 组 。 应 该 不 难 理解 ， 这 种 分 类 
是 就 某 棵 特定 的 深度 搜索 树 而 言 的 ， 或 者 说 ， 是 针对 各 邻接 表 中 节点 的 某 种 特定 次 序 〈 形 成 对 
G 的 一 次 特定 探索 ) 而 言 的 。 这 4 类 弧 分 别 如 下 。 

(1) 树 向 陶 ， 满 足 dfs (v) 被 afs (u) 调用 的 弧 u 一 v 。 

(2) 前 向 弧 〈forward arc )， 满 足 v 是 u 的 真子 孙 但 又 不 是 wu 的 子 市 点 的 弧 u 一 v。 例 如 ， 在 图 
9-29 中 ， 弧 a 一 5 就 是 唯一 的 前 向 弧 。 树 向 弧 都 不 是 前 向 弧 。 

(3) 后 向 绝 (backward arc )， 满足 v 是 u 在 该 树 中 的 祖先 (w=v 也 是 可 以 的 ) 的 弧 u 一 v。 图 
9-29 中 ， 弧 cc 一 2 是 唯一 的 后 回 弧 。 任 何 自 环 ， 也 就 是 节点 到 其 自身 的 弧 都 被 分 类 为 后 向 弧 。 
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(4) 横向 攻 ( cross arc )， 满 足 y 既 不 是 x 的 祖先 也 不 是 其 子孙 的 弧 z 一 vv 。 图 9-29 中 有 3 条 这 样 
的 弧 : dg 一 c 、e 一 c 和 J 一 c。 

在 图 9-29 中 ， 每 条 横 癌 弧 都 是 从 右 至 左 的 。 这 种 情况 并 非 巧 合 。 假 设 在 某 深 度 优先 搜索 树 
中 有 一 条 横 癌 弧 wu 一 vv 满足 u 在 v 的 左 侧 。 考 虑 一 下 在 调用 dfs (u) 期 间 会 发 生 什 么 。 到 完成 对 
dfs (u) 的 调用 之 时 ， 我 们 应 该 已 经 考虑 过 从 z 到 v 的 弧 了 。 如 果 * 尚 未 被 放置 到 树 中 ， 那 么 它 就 
会 成 为 u 在 该 树 中 的 子 节 点 。 因 为 这 种 情况 显然 不 会 发 生 ( 这 样 v 就 不 会 在 wu 的 右 侧 了 )， 所 以 在 
考虑 弧 w 一 v 时 ,vy 肯定 已 经 在 该 树 中 了 。 


< 一 一 
人 -一 动 调用 的 节点 
| 
1 
图 9-30 ”在 考虑 弧 u 一 v 时 构建 的 树 的 一 部 分 
不 过 , 图 9-30 展 示 了 当 afs (u) 处 于 活动 状态 时 存在 的 树 的 一 部 分 。 因 为 子 节点 会 按照 从 左 
至 右 的 次 序 添加 进来 ， 所 以 迄今 为 止 方 点 u 的 真 祖先 没有 子 节 点 在 u 的 右 侧 。 因 此 ，v 只 可 能 是 


的 祖先 ，wu 的 子孙 ， 或 者 是 在 wu 左 侧 的 某 个 位 置 。 因 此 ， 如 果 u 一 v 是 横向 弧 ，* 就 一 定 是 在 x 的 
左 侧 ， 而 不 可 能 像 我 们 最 初 假设 的 那样 在 u 的 右 侧 。 


9.6.3 ”深度 优先 搜索 森林 


在 示例 9.19 中 ， 我 们 特别 幸运 ， 从 节点 4 开始 ， 就 能 够 到 达 网 9-26 所 示 岁 的 全 部 节点 。 但 假 
设 我 们 从 其 他 节点 开始 ， 就 可 能 没 法 到 达 a，a 就 不 会 出 现在 深度 优先 树 中 。 因 此 ， 探 索 图 的 一 
般 方式 是 构建 一 系列 的 树 。 我 们 从 某 个 节点 wu 开始 并 调用 dfs (u)。 如 果 还 有 节点 未 被 访问 过 ， 
就 再 选择 一 个 节点 ， 比 方 说 是 vy， 并 调用 dfs (v) 。 只 要 还 有 节点 未 被 分 配 到 任 一 树 中 ， 就 继续 
重复 该 过 程 。 

在 所 有 节点 都 被 分 配 到 一 棵 树 中 后 ， 我 们 就 按照 构建 这 些 树 的 先后 次 序 ， 把 构建 出 的 树 
从 左 到 右 列 出 来 。 这 一 列 树 就 叫 作 深度 优先 搜索 森林 ( depth-first search forest )。 利 用 之 前 是 
义 的 NODE 和 GRAPH 数 据 类 型 , 可 以 通过 图 9-31 所 示 的 函数 , 从 所 需 的 那么 多 根 节 点 开始 搜索 ， 
对 完全 从 外 部 定义 的 图 C 进 行 探 索 。 这 里 我 们 假设 NODE 类 型 为 int 类 型 , 而 且 M4X 是 C 中 的 节 
点 数 。 





六 
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void dfsForest (GRAPH G) ; 
{ 
NODE uu; 


(1) for (u = 0; u < MAX; ut++) 

(2) G[u] .mark = UNVISITED ; 

(3) for (u = 0; u < MAX; U++) 

(4) if (G[u] .mark == UNVISITED) 
(5) dfs(u, G); 





} 
图 9-31 通过 探索 所 需 的 那么 多 树 对 图 进行 探索 


在 第 (1) 行 和 第 (2) 行 中 ， 我 们 会 把 所 有 节点 初始 化 为 UNVISITED。 然 后 ， 在 第 (3) 行 到 第 (5) 
行 的 循环 中 ， 要 依次 考虑 各 节点 u。 在 考虑 u 时 ， 如 果 该 节点 尚未 被 添加 到 任何 树 中 ， 那 么 在 进 
行 第 (4) 行 的 测试 时 它 仍然 会 被 标记 为 未 被 访问 过 。 在 这 样 的 情况 下 ， 我 们 就 会 在 第 (5) 行 调用 
dfs (u,G) ， 并 探索 以 z 为 根 节点 的 深度 优先 搜索 树 。 特 别 要 说 的 是 ， 第 一 个 节点 总 是 会 成 为 树 
的 根 节 点 。 不 过 ， 如 果 在 执行 第 (4) 行 的 测试 时 x 已 经 被 添加 到 树 中 ， 那 么 x 就 会 被 标记 为 
VISITED， 因 此 不 会 创建 以 z 为 根 节 点 的 树 。 


+ 示例 9.20 

假设 将 上 述 算法 应 用 到 图 9-26 所 示 的 图 上 ， 但 是 设 4 是 名 称 为 0 的 节点 ,也 就 是 说 ,ad 是 该 深 
度 搜索 生成 森林 中 树 的 第 一 个 根 节点 。 调 用 dfs (a), 这 会 构建 图 9-32 中 的 第 一 棵 树 。 现 在 除了 a 
之 外 的 所 有 节点 都 已 经 被 访问 过 。 当 x 在 图 9-31 第 (3) 行 到 第 (9) 行 的 循环 中 成 为 各 节点 时 ， 除 了 zx 
= 4 时 之 外 第 (4) 行 的 测试 都 会 失败 。 然后 , 我 们 会 创建 如 图 9-32 所 示 的 单 节点 第 二 棵 树 。 请 注意 ， 
在 调用 afs ta) 时 ，a 的 两 个 后 继 都 带 有 VISITED 标 记 ， 因 此 我 们 不 再 从 afs (a) 进行 任何 递归 
调用 。 








图 9-32 ”深度 优先 搜索 森林 


当 把 图 中 的 节点 表示 为 深度 优先 搜索 森林 时 ， 前 癌 弧 、 后 癌 弧 与 树 癌 弧 的 概念 还 像 之 前 那 
样 。 不 过 ， 横 向 弧 的 概念 必须 扩展 到 包含 那些 从 一 棵 树 到 其 左 侧 的 树 的 弧 。 这 种 横 癌 弧 的 例子 
包括 图 9-32 中 的 a 一 b 和 a 一 4。 

横 癌 弧 总 是 从 右 至 左 的 这 一 规则 继续 成 立 。 原 因 还 是 一 样 的 。 如 果 存 在 从 一 棵 树 到 其 右 侧 
树 的 横 癌 弧 wu 一 v ， 那 么 考虑 一 下 当 调 用 afs (u) 时 会 发 生 什 么 。 因 为 v 没 有 被 添加 到 当时 正在 
形成 的 树 中 ， 所 以 它 肯 定 已 经 在 某 棵 树 中 。 但 是 u 右 侧 的 树 尚 未 创建 ， 因 此 vw 不 可 能 是 这 些 树 的 
一 部 分 。 
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尽善尽美 的 深度 优先 搜索 
无 论 节 点 数 和 弧 数 之 间 存 在 什么 的 关系 ,对 图 的 深度 优先 探索 需要 的 时 间 是 与 图 的 “大 小 ” 
(也 就 是 节点 数 与 弧 数 之 和 ) 成 正比 的 。 因 此 ， 深 度 优先 搜索 与 其 他 任意 “查看 ”图 的 算法 在 
速度 上 只 有 常数 因子 的 差异 。 





9.6.4 深度 优先 搜索 算法 的 运行 时 间 

设 G 是 有 nn 个 节点 的 图 ， 并 设 m 是 节点 数 与 弧 数 之 间 的 较 大 者 。 图 9-31 所 示 的 df sForest 就 
要 花 O (m) 的 时 间 。 这 一 事实 的 证 明 需 要 一 点 小 花招 。 在 计算 对 dfs (u) 的 调用 所 花 的 时 间 时 ， 
我 们 不 会 将 图 9-27 第 (6) 行 中 对 afs 的 递归 调用 所 花 的 时 间 计 算 在 内 ,就 像 3.9 节 中 所 建议 的 那样 。 
不 过 ,不 难看 出 要 为 每 个 u 值 调用 dfu (uv) 一 次 。 因 此 ， 如 果 将 每 次 调用 的 开销 加 起 来 ， 除 挥 其 
递归 调用 ， 就 能 得 到 将 所 有 调用 视 作 一 个 整体 所 花 的 总 时 间 。 

请 注意 ， 除 挥 在 对 dfs 的 递归 调用 中 所 花 的 时 间 ， 图 9-27 中 第 (3) 行 到 第 (7) 行 的 while 循 环 
所 花 的 时 间 是 可 以 变化 的 ， 因 为 闻 点 wu 的 后 继 数 量 可 能 是 从 0 到 n 的 任 一 数字 。 假 如 设 m 是 节点 u 
的 出 度 ， 也 就 是 x 的 后 继 的 数量 。 那 么 在 执行 afs (u) 期 间 进行 该 循环 的 次 数 就 肯定 是 m,。 在 评 
佑 afs (u) 的 运行 时 间 时 ， 并 不 会 把 第 (6) 行 执行 afs(v,G) 的 时 间 计 算 在 内 ， 而 除 该 调用 之 外 ， 
整个 循环 体 只 要 花 O 0) 的 时 间 。 因 此 ,除去 在 递归 调用 上 花 的 时 间 , 第 (3) 行 到 第 (7) 行 的 循环 花 
的 总 时 间 就 是 O (1+m,)， 这 个 附加 的 1 是 必要 的 ， 因 为 m, 可 能 为 0， 在 这 种 情况 下 我 们 仍然 需要 
为 第 (3) 行 的 测试 花 上 O (1) 的 时 间 。 因 为 第 (1) 行 和 第 (2) 行 的 dfs 要 花 O(1) 的 时 间 , 所 以 可 以 得 出 
结论 ， 忽 略 递 归 调 用 ，dfs (u) 要 花 O (1+m) 的 时 间 完 成 调用 。 

现在 可 以 看 到 , 在 运行 afsForest 期 间 , 刚好 要 为 每 个 u 值 调用 dfs (u) 一 次 。 因 此 , 花 在 
所 有 这 些 调用 上 的 总 时 间 是 花 在 每 次 调用 上 的 时 间 之 和 的 大 0O， 也 就 是 0(2》, (1+tm)) 。 但 是 
> 7 就 是 图 中 弧 的 数量 ,也 就 是 最 多 为 m,“ 因 为 每 条 弧 都 是 都 某 一 个 节点 发 出 的 。 节 点 数 为 
n， 所 以 > 1 就 是 x。 由 于 n 夺 m ， 因 此 所 有 对 afs 的 调用 花 的 总 时 间 就 是 0 (m)。 

最 后 ， 必 须 考 虑 afsForest 花 的 时 间 。 图 9-31 所 示 的 该 程序 由 各 要 迭代 xz 次 的 两 个 循环 组 
成 。 不 难看 出 ,除去 对 dfs 的 调用 , 循环 体 所 花 的 时 间 是 0 (1)， 因 此 这 些 循环 的 开销 都 是 0 (n)。 
这 一 时 间 会 被 对 dfs 的 调用 所 花 的 O (m) 时 间 主 导 。 因 为 我 们 已 经 弄 清 了 dfs 调 用 所 花 的 时 间 ， 
所 以 可 以 得 到 afsForest， 再 加 上 其 所 有 对 afs 的 调用 ， 要 花 O (m) 的 时 间 。 


9.6.5 “有 向 图 的 后 序 遍 历 


一 旦 有 了 深度 优先 搜索 树 ， 就 可 以 按 后 序 为 其 节点 编写。 不过， 还 有 一 种 在 搜索 期 间 进行 
编号 的 简单 方法 。 只 要 把 为 节点 z 动 上 编号 当 作 afs (u) 完成 前 我 们 要 做 的 最 后 一 件 事 即 可 。 然 
后 ， 在 节点 的 所 有 子 节 点 被 编号 后 ， 它 自己 就 会 被 编 上 号 ， 正 好 是 按照 后 序 编号 的 。 


+ 示例 9.21 
图 9-29 所 示 的 树 ， 也 就 是 我 们 对 图 9-26 中 的 图 进行 深度 优先 搜索 所 建立 的 树 ， 有 着 后 序 编 
号 的 节点 标号 。 如 果 查 看 图 9-28 的 过 程 ， 就 会 发 现 最 先 要 返回 的 调用 是 dfs (c) ， 而 且 节 点 c 会 














QD 其实，m, 的 和 刚好 是 m ， 除 非 节点 数 大 于 弧 数 。 回 想 一 下 ，m 是 节点 数 与 弧 数 间 的 较 大 者 。 
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被 编 为 1 号 。 然 后 我 们 会 访问 4， 接 着 是 e， 并 从 对 e 的 调用 返回 。 因 此 ，e 的 编号 是 2。 同 样 ， 我 
们 会 访问 并 从 其 返回 ， 它 会 被 编 为 3 号 。 至 此 ,已 经 完成 了 对 qd 的 调用 ， 它 会 得 到 4 这 个 编号 。 
这 样 就 完成 了 对 afs (b) 的 调用 ， 因 此 b 的 编号 就 是 5。 最 后 ， 最 开始 对 a 的 调用 返回 ， 给 了 a 编号 
6。 请 注意 ， 这 一 次 序 刚好 就 是 我 们 以 后 序 遍 历 该 树 会 得 到 的 。 

我 们 可 以 对 目前 所 编写 的 深度 优先 算法 进行 一 些 简单 改动 ， 从 而 为 节点 指定 后 序 编 号 ， 这 
些 改动 如 图 9-33 所 总 结 。 

















int k;/* 为 已 访问 过 的 节点 计数 */ 


void dfs(NODE u, GRAPH G) 
{ 
LIST p; /* 指向 u 的 邻接 表 的 单元 */ 
NODE Vv; /* 由 p 指 向 的 单元 中 存放 的 节点 */ 


G[Lu] .mark = VISITED ; 

p = G[u] .successors; 

while (p != NULL) 荆 
V = p->nodeName,; 
if (G[v] .mark == UNVISITED) 

dfs(v, G); 

P = p->next; 

} 

二 二 区 ; 

G[u] .postorder = k; 

} 


void dfsForest (GRAPH G) 
{ 


NODE u; 


k = 0; 
for (u = 0; u < MAX; u++) 
GLu] .mark = UNVISITED ; 
for (u = 0; u < MAX; u++) 
if (G[u] .mark == UNVISITED) 
dfs(u, G); 





图 9-33 ”以 后 序 为 有 向 图 的 节点 编号 的 例 程 


(1) 在 GRAPH 类 型 中 ,需要 为 每 个 节点 增加 一 个 名 为 postorder 的 字段 。 对 图 G 而 言 , 我们 
要 将 节点 4 的 后 序 编号 放 在 G1u] .postorder 中 。 这 一 赋值 是 在 图 9-33 的 第 (9) 行 完成 的 。 

(2) 我 们 使 用 全 局 变量 k 按 后 序 为 节点 计数 。 这 一 变量 是 在 afs 和 dafsForest 的 外 部 定义 
的 。 正 如 在 图 9-33 中 所 见 ， 我 们 在 afsForest 的 第 (10) 行 将 人 和 始 化 为 0， 并 刚好 在 赋值 后 序 编 
号 之 前 ,在 afs 中 的 第 (8) 行 将 /递增 1。 

请 注意 ， 这 样 一 来 ， 当 深度 优先 搜索 森林 中 不 止 有 一 棵 树 时 ， 第 一 棵 树 就 会 得 到 最 低 的 编 
号 ， 而 紧 接着 的 那 棵 树 就 会 按 顺序 得 到 接 下 来 的 编号 ， 以 此 类 推 。 例 如 ， 在 图 9-32 中 ，4 会 得 到 
后 序 编号 6。 


9.6.6 ”后 序 编号 的 特殊 属性 


横向 弧 不 能 从 左 向 右 说 明了 与 后 序 编号 和 图 的 深度 优先 表示 中 4 种 弧 相关 的 一 些 有 趣 而 实 
用 的 信息 。 在 图 9-34a 中 ， 我 们 看 到 图 的 深度 优先 表示 中 有 wu、v 和 w3 个 三 点 。 厄 点 v 和 w 是 u 的 子 
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孙 ， 而 且 w 在 * 的 右 侧 。 图 9-34b 展 示 了 分 别 为 这 3 个 节点 调用 dafs 各 自 的 活动 持续 时 间 。 


a 


(a) 深度 优先 树 中 的 三 个 市 点 


| joe | 
Le [| 
vy 的 时 间 w 的 时 间 
4 的 时 间 
(b) 它们 对 dfs 调 用 的 活动 区 间 
图 9-34 ” 树 中 位 置 间 的 关系 和 调用 的 持续 时 间 


我 们 可 以 得 出 一 些 观点 。 首 先 ， 对 子孙 节点 〈 比 如 ”>) 进行 的 对 dfs 的 调用 ， 只 在 对 祖先 市 
点 《比如 u) si i cu 特别 要 指出 的 是 ， 对 dfs (v) 的 调用 会 
在 对 dfs (u) 的 调用 之 前 终止 。 因此 , 只 要 v 是 u 的 真子 孙 , v 的 后 序 编 号 肯定 要 比 w 的 后 序 编号 小 。 

其 次 ， 如 果 w 在 v 的 右 侧 ， 那么 对 afs (w) 的 调用 必须 等 到 对 dfs (v) 的 调用 终止 后 才 会 开始 。 因 

LE， 只 要 vy 在 w 的 左 侧 ，v 的 后 序 编号 就 要 比 w 的 后 序 编 号 小 。 虽 然 图 9-34 中 没有 表示 出 来 ,但 即便 y 

和 w 在 深度 优先 搜索 森林 的 不 同 树 中 , 只 要 vy 所 在 的 树 在 w 所 在 的 树 的 左 侧 , 同样 的 结论 也 是 成 立 的 。 

我 们 现在 可 以 为 每 条 弧 u 一 v 考虑 u 和 v 后 序 编号 之 间 的 关系 了 。 

(1) 如 果 u 一 v 是 树 癌 弧 或 前 疝 弧 ， 那 么 v 是 wu 的 子孙 ， 所 以 vy 按 后 序 要 先 于 u。 

(2) 如 果 w 一 >v 是 横向 弧 ， 那 么 我 们 知道 y 在 uw 的 左 侧 ， 因 此 按 后 序 v 还 是 先 于 wu。 

(3) 如 果 wu 一 v 是 后 向 弧 而 且 x zyv ， 那么 vy 是 uw 的 真 祖先 ， 因 此 按 后 序 v 在 wu 之 后 。 不过， 对 后 
问 弧 而 言 v=w 是 有 可 能 的 ， 因 为 自 环 也 是 后 疝 弧 。 因 此 ， 一 般 来 说 ， 对 后 癌 弧 u 一 vv 而 言 ， 我 
们 知道 y 的 后 序 编 号 是 不 会 小 于 u 的 后 序 编号 的 。 

总 之 ， 我 们 看 到 ， 弧 头 部 按 后 序 是 要 先 于 尾部 的 ， 除 非 该 弧 是 后 向 弧 ， 在 弧 是 后 向 弧 的 情 
况 中 ， 尾 部 按 后 序 是 不 会 在 头 部 之 后 的 。 因 此 ， 只 要 找到 那些 尾部 按 后 序 不 大 于 头 部 的 弧 ， 就 
可 以 认定 它们 是 后 向 弧 。 我 们 在 9.7 节 中 将 看 到 这 一 概念 的 若干 应 用 。 


9.6.7 习题 


(D 为 图 9-5 中 的 树 ( 见 9.2 节 的 习题 ) 给 出 两 棵 从 节点 a 出 发 的 深度 优先 搜索 树 。 给 出 从 节点 出现 的 
深度 优先 搜索 树 。 

CO) * 不 管 从 图 9-5 中 的 哪个 节点 开始 ， 我 们 最 后 都 只 得 到 深度 优先 搜索 森林 中 的 一 棵 树 。 简 要 解释 对 
这 幅 特定 的 图 为 什么 一 定 是 这 种 情况 。 
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(3) 对 9.6 节 习题 (1) 中 的 各 棵 树 ， 指 出 哪些 弧 是 树 向 弧 、 前 向 弧 、 后 向 弧 和 横向 弧 。 

(4) 对 9.6 节 习题 (1) 中 的 各 棵 树 ， 给 出 节点 的 后 序 编号 。 

(5)* 考虑 含 a、bp、c 这 3 个 节点 以 及 a 一 b 和 4b 一 c 这 两 条 弧 的 图 。 为 这 幅 图 给 出 所 有 可 能 的 深度 优先 
搜索 森林 ， 为 每 棵 树 考 虑 所 有 可 能 的 起 始 节 点 。 每 个 森林 的 节点 后 序 编号 各 是 怎样 的 ? 

(6)* 考虑 把 习题 (5) 的 图 一 般 化 为 具有 a 、a,; 、…、a, 这 7 个 节点 和 am 一 0 、o 一 0 、 qa 
这 些 弧 ,通过 对 n 的 完全 归纳 证 明 , 该 图 具有 2” 种 不 同 的 深度 优先 搜索 森林 。 提示: 记 住 对 i 宇 0 
有 1+1+2+4+8+…+2'=2+1l 是 能 帮 上 忙 的 。 

(7) * 假设 从 图 G 开 始 ， 并 为 G 添 加 一 个 新 节点 xz， 它 是 原来 的 图 G 中 所 有 节点 的 前 导 。 如 果 从 节点 x* 开 
全 对 新 图 运行 图 9-31 中 的 dfsForest， 就 只 得 到 一 棵 树 。 如 果 接 着 将 x 从 该 树 中 删除 ， 就 可 以 得 
到 若干 棵 树 。 这 些 树 与 原 图 G 的 深度 优先 搜索 森林 之 间 有 什么 联系 ? 

(8) ** 假设 有 一 幅 有 向 图 G， 我 们 已 经 通过 图 9-31 所 示 的 算法 从 这 幅 有 向 图 的 表示 构建 了 深度 优先 生成 
森林 F, 现在 将 弧 u 一 添加 到 图 G 中 形成 新 图 瓦 ,除了 节点 "出 现在 节点 z 相 应 邻接 表 中 的 某 个 位 置 ， 
图 的 表示 与 图 G 的 表示 如 出 一 略 。 如 果 现 在 对 态 的 这 种 表示 运行 图 9-31 所 示 的 算法 ， 在 什么 条 件 下 
会 构建 出 相同 的 深度 优先 森林 FF? 也 就 是 说 ，E 的 树 向 弧 什 么 时 候 会 刚好 与 G 的 树 向 弧 相 同 ? 
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在 本 节 中 ， 我 们 会 看 到 如 何 利用 深度 优先 搜索 快速 解决 一 些 问 题 。 就 像 之 前 那样 ， 这 里 也 
是 用 n 表 示 图 的 市 点 数 ， 并 用 mm 表示 疗 点 数 与 弧 数 间 的 较 大 者 ， 特 别 要 指出 的 是 ,假设 n 志 m 总 
是 成 立 的 。 这 里 介绍 的 算法 对 用 邻接 表 表示 的 图 来 说 都 要 花 O (m) 的 时 间 。 第 一 个 算法 可 以 确定 
有 问 图 是 否 为 无 环 的 。 然 后 对 那些 无 环 图 , 我 们 会 看 到 如 何 找 出 其 节点 的 拓扑 排序 ( 拓扑 排序 在 
7.10T 讨论 过 ， 我 们 会 找 个 恰当 的 时 机 回顾 一 下 其 定义 ) 我们 还 要 展示 如 何 计算 图 的 传递 闭 包 
(概念 还 是 见 7.10 闻 )， 以 及 如 何 比 用 9.4 中 给 出 的 算法 更 快 地 找到 无 向 图 的 连通 分 文 。 

9.7.1 有 向 图 中 环 路 的 寻找 

在 对 有 向 图 G 进 行 深 度 优先 搜索 期 间 ， 可 以 在 0 (m) 的 时 间 内 为 所 有 方 点 指定 后 序 编号 。 回 
想 一 下 9.6 市 的 内 容 , 我 们 发 现 尾部 按 后 序 小 于 等 于 其 头 部 的 弧 只 有 后 向 弧 。 只 要 某 图 存在 后 癌 
弧 u 一 v， 其 中 v 的 后 序 编号 不 小 于 wu 的 后 序 编号 ,该 图 中 就 一 定 存在 环 路 ， 如 图 9-35 所 示 。 这 条 
环 路 是 由 从 wu 到 vy 的 弧 以 及 树 中 从 vy 到 其 子孙 ww 的 路 径 组 成 的 。 











图 9-35 ”每 条 后 向 弧 都 可 以 与 树 向 弧 一 起 构成 环 路 


400 第 9 章 ”图 数据 模型 





这 个 命题 反 过 来 也 是 成 立 的 ， 也 就 是 说 ， 如 果 图 中 存在 环 路 ， 那 么 就 肯定 存在 后 问 产 。 要 
知道 原因 ， 先 假设 存在 某 环 路 ， 比 方 说 w 二 二 … 二 二 VW， 并 设 对 i=1、2、…、k, 节点 v 
的 后 序 编号 为 pi。 如 果 k=1, 也 就 是 说 , 环 路 为 一 条 弧 , 那么 在 图 G 的 任意 深度 优先 表示 中 v 一 
都 肯定 是 后 问 弧 。 

如 果 k> 1, 假设 v 一 vv, ，v, 一 ， 等 等 ， 直 到 vv， 一 vw 这 些 弧 都 不 是 后 向 弧 。 那 么 每 条 弧 
的 头 部 按 后 序 都 先 于 其 尾部 ,而 且 后 序 编号 pi1、p，、…… pi 形成 了 递减 序列 ,特别 要 说 的 是 , P<P 。 
然后 考虑 完成 该 环 路 的 弧 v, 一 ww 。 其 尾部 的 后 序 编 号 为 p:， 要 小 于 其 涉 部 的 后 序 编 号 p!， 所 以 
这 条 弧 是 后 疝 缴 。 这 就 证 明了 在 环 路 中 肯定 存在 后 癌 弧 。 

这 样 一 来 ， 在 计算 了 所 有 市 点 的 后 序 编 号 后 ， 只 要 检查 所 有 弧 ， 看 看 有 没有 弧 的 尾部 按 后 
序 小 于 等 于 其 头 部 。 如 果 有 ， 我 们 就 找到 了 后 癌 弧 ， 而 且 该 图 是 有 环 图 。 如 果 没 有 这 样 的 弧 ， 
该 图 就 是 无 环 图 。 图 9-36 展 示 了 测试 外 部 定义 的 图 G 是 否 为 无 环 图 的 孔 数 , 它 所 使 用 的 表示 图 的 
数据 结构 与 9.6 方 中 描述 的 相同 。 它 还 利用 了 图 9-33 中 定义 的 dfsForest 也 数 计算 G 中 节点 的 后 
序 编号 。 

















BOOLEAN testAcyclic(GRAPH G) 
{ 
NODE u，V; /* uu 会 行经 所 有 的 节点 */ 
LIST p; /* p 指 向 与 u 对 应 的 邻接 表 中 的 各 个 单元 ， 
V 是 该 邻接 表 中 的 节点 */ 


dfsForest(G) ; 
for (u = 0; u < MAX; u++) { 
p = G[uj .successors; 
while (p != NULL) { 
V = p->nodeName; 
if (G[u] .postorder <= G[v] .postorder) 
return FALSE: 
p = p->next; 


HY eg eT he he 
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} 
return TRUE ; 


es 
So 
Se 





图 9-36 ”确定 图 G 是 否 无 环 的 函数 


在 第 (1) 行 调用 dfsForest 计 算 后 序 编 号 之 后 ， 我 们 会 在 第 (2) 行 到 第 (8) 行 的 循环 中 检查 各 
节点 u。 指 针 p 会 沿 着 u 对 应 的 邻接 表 问 下 行进 ， 而 且 在 第 (5) 行 ，v 会 依次 成 为 u 的 各 个 后 继 。 如 
果 在 第 (6) 行 发 现 u 按 后 序 等 于 或 先 于 vyv， 就 找到 了 后 向 弧 wu 一 >v ， 并 在 第 (7) 行 返回 FALSE。 如 果 
没有 找到 这 样 的 弧 ， 就 在 第 (9) 行 返回 TRUE。 

9.7.2 无 环 测试 的 运行 时 间 

和 之 前 一 样 ， 设 n 是 图 G 中 节点 的 数量 ， 并 设 m 是 节点 数 与 弧 数 之 间 的 较 大 者 。 我 们 已 经 知 
道 在 图 9-36 的 第 (1) 行 中 对 dfsForest 的 调用 要 花 O (m) 的 时 间 。 而 第 (5) 到 第 (8) 行 是 while 循 环 
的 循环 体 ， 显 然 要 花 O (的 时 间 。 要 得 到 while 循 环 本 身 运 行 时 间 的 良好 边界 ， 就 必须 用 到 我 
们 在 9.6 节 中 为 深度 优先 搜索 的 时 间 确 定 边界 时 用 到 的 小 记 血 。 设 mw 是 市 点 wu 的 出 度 ， 那 么 第 (4) 
行 到 第 (8) 行 的 循环 就 要 进行 m, 次 。 因 此 ， 第 (4) 行 到 第 (8) 行 所 花 的 时 间 是 0 (1+m)。 
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第 (3) 行 只 要 花 0(1) 的 时 间 ， 因 此 第 (Q2) 行 到 第 (8) 行 的 for 循 环 所 花 的 时 间 是 0(2》, (+m,))。 
正如 在 9.6 节 中 验证 过 的 ， 这 些 1 的 和 是 O (n)，mw 的 和 则 是 m。 由 于 nn 三 m， 所 以 第 (2) 到 第 (8) 行 
的 for 循 环 的 运行 时 间 就 是 O (m)。 正 如 深度 优先 搜索 本 和 号 那 样 ， 检 测 环 路 的 时 间 与 查看 整 幅 图 
所 花 的 时 间 也 只 有 常数 因子 的 差别 。 


9.7.3 ”拓扑 排序 


假设 我 们 知道 有 向 图 G 是 无 环 的 ,就 像 对 任意 图 那样 , 可 以 为 G 找 到 一 个 深度 优先 搜索 森林 ， 
并 为 G 的 市 点 确定 后 序 编号 。 假 设 (V1， vy，…，v) 是 图 G 的 节点 按 后 序 反 癌 排 列 的 表 ， 也 就 是 说 
v1 是 后 序 编号 为 n 的 市 点 ，v 的 编号 为 -1， 而 且 一 般 而 言 ，vj 是 后 序 编号 为 n- 计 1 的 节点 。 

该 表 中 节点 的 次 序 具 有 这 样 的 属性 ，G 中 所 有 弧 都 是 按照 该 次 序 癌 前 行进 的 。 要 知道 原因 ， 
假设 v 一 v 是 G 中 的 弧 。 因 为 C 是 无 环 图 ， 所 以 其 中 肯定 不 存在 后 向 弧 。 因 此 ， 对 每 条 弧 而 言 ， 
其 头 部 按 后 序 部 是 先 于 尾部 的 。 也 就 是 说 ,vj 按 后 序 要 先 于 vi。 不 过 表 是 与 后 序 反 向 的 ， 所 以 在 
表 中 vj 要 先 于 v;。 也 就 是 说 ， 按 照 表 的 次 序 每 条 弧 的 尾部 都 要 先 于 其 头 部 。 

有 具有 图 中 每 条 弧 的 尾部 都 先 于 头 部 这 种 属性 的 图 C 中 ， 节 点 的 次 序 叫 作 拓扑 次 序 ， 而 为 这 
些 布 点 找到 这 一 次 序 的 过 程 就 叫 作 拓 扑 排 序 。 只 有 无 环 图 才 有 拓扑 次 序 ， 而 且 正 如 我 们 已 经 看 
到 的 ， 通 过 深度 优先 搜索 ， 可 以 在 O (om 的 时 间 内 为 无 环 图 生成 拓扑 次 序 ， 其 中 必 是 节点 数 和 弧 
数 之 间 的 较 大 者 。 如 果 要 为 某 节 点 给 定 后 序 编号 ， 也 就 是 要 完成 对 该 节点 的 afs 调 用 ， 我 们 会 
将 该 节点 压 入 栈 中 。 在 完成 所 有 调用 后 ， 该 栈 就 成 了 市 点 按 后 序 出 现 的 表 ， 其 中 编号 最 大 的 市 
点 位 于 栈 顶 《前 端 ) 这 就 是 我 们 所 需要 的 反 向 后 序 。 因 为 深度 优先 搜索 要 花 O (m) 的 时 间 ， 而 
且 将 节点 压 人 栈 只 需要 O (0o) 的 时 间 ， 所 以 整个 过 程 要 花费 O (m) 的 时 间 。 















































拓扑 次 序 和 环 路 查找 的 应 用 


本 节 中 讨论 的 算法 在 不 少 情况 下 是 很 实用 的 。 当 执行 用 节点 表示 的 特定 任务 所 依照 的 次 序 
有 约束 时 ,拓扑 排序 就 会 变 得 很 方便 。 如 果 在 执行 任务 v 之 前 必须 执行 u, 就 画 一 条 从 u 到 vy 的 陶 ， 
然后 拓扑 次 序 就 是 我 们 执行 所 有 任务 所 依照 的 次 序 。 

非 递归 函数 集合 的 调用 图 也 是 相似 的 例子 , 在 这 种 情况 下 我 们 要 在 分 析 了 某 函 数 调用 的 函 
数 之 后 再 分 析 该 函数 。 因 为 弧 是 从 调用 者 到 被 调用 函数 的 ， 所 以 拓扑 次 序 的 相反 次 序 ， 也 就 是 
后 序 本 身 是 我 们 分 析 函 数 所 依照 的 次 序 , 以 确保 我 们 只 会 在 处 理 完 某 函数 调用 的 函数 后 再 来 处 
理 该 函数 。 

在 其 他 情况 下 , 运行 该 环 路 测试 也 是 有 效 的 。 例 如 ,表示 任务 优先 级 的 图 中 所 含 的 环 路 就 
表示 执行 所 有 任务 是 没有 次 序 可 依照 的 ， 而 调用 图 中 的 环 路 表示 存在 递归 调用 。 





+ ”示例 9.22 

在 图 9-37a 中 有 一 幅 无 环 图 ， 而 在 图 9-37b 中 是 按照 字母 表 次 序 考虑 节点 后 得 到 的 深度 优先 
搜索 木林。 我们 在 图 9-37b 中 还 展示 了 从 这 次 深度 优先 搜索 中 得 到 的 后 序 编 号 。 如 果 最 先 把 后 序 
编号 最 高 的 节点 列 出 来 , 我 们 就 得 到 拓扑 次 序 (4, e, c, f, b, a)。 读者 应 该 自行 验证 一 下 图 9-37a 
的 8 条 弧 中 每 条 弧 的 尾部 按照 该 表 的 次 序 都 先 于 其 涉 部 。 而 这 幅 图 恰好 还 有 男 外 3 种 拓扑 次 序 ， 
比如 (d, c, e, b, f, a)。 
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9.7.4 可 达 性 问题 


对 于 有 向 图 可 以 提出 一 个 很 自然 的 问题 : 给 定 一 个 节点 w， 沿 着 有 问 图 中 的 弧 从 u 可 以 到 达 
哪些 节点 ? 我们 将 该 节点 集合 称 为 闻 点 wu 的 可 达 集 。 其 实 ， 如 果 对 图 中 每 个 节点 wu 都 询问 这 一 可 
达 性 问题 ， 就 能 知道 对 哪些 节点 对 (uw，v) 而 言 存在 从 u 到 v 的 路 径 。 

解决 可 达 性 问题 的 算法 很 简单 .如 果 我 们 对 节点 x 感 兴趣 , 就 将 所 有 节点 标记 为 UNVISITED 
并 调用 dfs (u) 。 然 后 可 以 再 次 检测 所 有 节点 。 那 些 标 记 上 VISITED 的 节点 就 是 从 x 可 达 的 节点 ， 
而 其 他 节点 则 不 是 。 如 果 想 找到 从 另 一 个 节点 可 达 的 节点 ， 就 将 所 有 节点 再 次 置 为 
UNVISITED， 并 调用 afs (u) 。 我 们 可 以 为 所 有 想 要 处 理 的 节点 重复 该 过 程 。 


+ 示例 9.23 

考虑 图 9-37a。 如 果 从 节点 a 开始 进行 深度 优先 搜索 ,我 们 哪里 都 去 不 了 ， 因 为 没有 从 a 发 出 
的 弧 。 因 此 ，dfs (a) 会 立即 终止 。 因 为 只 有 a 被 访问 过 ， 所 以 可 以 得 出 结论 ，a 是 从 a 可 达 的 唯 
一 节 成 & 

如 果 从 bp 开始 ， 可 以 到 达 a， 但 这 也 就 是 全 部 了 ， 所 以 b 的 可 达 集 就 是 {fa，b}。 同 样 ， 从 c 开 
始 可 以 到 达 {fe, 2，c, 凡 ， 从 a 则 可 以 到 达 所 有 节点 ， 从 e 可 以 到 达 {a,，b，e, 凡 ， 而 从 只 可 以 到 
达 {a, 几 。 

再 举 个 例子 ， 考 虑 一 下 图 9-26。 从 a 可 以 到 达 所 有 的 节点 。 不 过 从 除了 a 之 外 的 任意 节点 出 
发 ， 可 以 到 达 除 了 a 之 外 的 所 有 节点 。 





(b) 深度 优先 搜索 森林 
图 9-37 无 环 图 的 拓扑 排序 
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9.7.5 ”可 达 性 测试 的 运行 时 间 


假设 有 问 图 G 含 n 个 节点 与 m 条 弧 。 还 假设 G 是 用 9.6 节 中 的 GRAPH 数 据 类 型 表示 的 。 首 先 ， 
假设 我 们 想 为 某 节 点 zx 找到 其 可 达 集 。 将 所 有 节点 初始 化 为 UNVISITED 需 要 O (n) 的 时 间 。 对 
dfs(u,G) 的 调用 要 花 O (0m) 的 时 间 ， 而 且 再 次 检查 所 有 节点 看 哪些 节点 被 访问 过 需要 O (o) 的 时 
间 。 在 检查 节点 之 时 ， 我 们 还 可 以 创建 由 从 节点 可 达 的 节点 组 成 的 表 ， 这 仍然 只 用 花 O (n) 的 
时 间 。 因 此 ， 为 一 个 节点 找到 可 达 集 要 花 O (m) 的 时 间 。 

现在 假设 需要 为 所 有 7 个 节点 找 出 可 达 集 。 我 们 可 以 重复 该 算法 zi 次， 为 每 个 节点 执行 一 次 
该 算法 。 因 此 ， 总 时 间 为 O (mn)。 
9.7.6 ”通过 深度 优先 搜索 寻找 连通 分 支 

在 9.4 节 中 ,我 们 给 出 了 为 节点 数 为 z 上 且 节 点 数 与 边 数 较 大 值 为 记 的 无 向 图 寻找 连通 分 文 的 算 
法 ， 该 算法 的 运行 时 间 为 O (m log n)。 我 们 用 于 合并 分 支 的 树 结构 本 映 是 很 有 意义 的 ， 例 如 ， 
可 以 利用 它 帮 助 实现 克 鲁 斯 卡尔 的 最 小 生成 树 算 法 。 不 过 ， 如 果 使 用 深度 优先 搜索 ， 我 们 可 以 
更 高 效 地 找到 连通 分 文 。 正 如 接 下 来 将 要 看 到 的 ，O (m) 的 时 间 就 足够 了 。 

思路 就 是 把 无 癌 图 当 作 边 被 两 个 方 和 辐 上 的 弧 蔡 代 后 的 有 问 图 。 如 果 用 邻接 表 表 示 图 ， 那 么 
其 至 不 用 对 这 种 表示 进行 任何 修改 。 现 在 为 该 有 向 图 构建 深度 优先 搜索 森林 ， 和 森林 中 的 每 棵 树 
都 是 该 无 向 图 的 一 个 连通 分 支 。 














传递 闭 包 和 自 反 传递 闭 包 


设 R 是 集合 S 上 的 二 元 关系 。 可 达 性 问题 就 可 以 视 作 计算 R 的 自 反 传递 闲 包 ， 通常 将 其 表示 
为 R 。 关 系 R 是 满足 以 下 条 件 的 有 序 对 (u,v) 的 集合 ， 在 由 R 表 示 的 图 中 ， 从 节点 u 到 节点 v 存 在 
长 度 为 0 或 0 以 上 的 路 径 。 

另 一 种 非常 类 似 的 关系 是 R ， 也 就 是 R 的 传递 闭 包 ， 它 是 满足 如 下 条 件 的 有 序 对 (4，v) 的 
集合 。 在 由 R 表 示 的 图 中 ， 从 节点 u 到 节点 v 存 在 长 度 为 1 或 1 以 上 的 路 径 。R 和 R' 之 间 的 区 别 在 
于 ，(u，) 对 S 中 的 每 个 U 而 言 都 在 R 中 ,而 当 上 且 仅 当 从 u 到 u 之 间 存 在 一 条 长 度 为 1 或 1 以 上 的 环 
路 时 ，(u，, ) 才 在 RR 中。 要 从 R 计算 R ， 只 需要 检查 每 个 节点 是否 有 来 自 其 可 达 节 点 (包括 它 
本 身 ) 的 进入 攻 (entering arc )， 如 果 没 有 ， 就 将 u 从 它 自 己 的 可 达 集 中 删除 。 





要 知道 原因 ， 首 先 要 注意 到 有 向 图 中 的 弧 u 一 vv 的 出 现 表示 存在 边 {u，v}。 因 此 ， 树 中 的 
所 有 市 点 都 是 连通 的 。 

现在 我 们 必须 证 明 反 向 的 命题 ， 也 就 是 如 果 两 个 方 点 是 连通 的 ， 那么 它们 在 同一 棵 树 中 。 假 
设 在 无 向 图 中 存在 连通 不 同 树 中 两 个 节点 uv 的 路 径 。 假如 4 的 树 是 首先 构建 起 来 的 。 那么 在 有 疝 
图 中 存在 从 u 到 v 的 路 径 ， 这 表明 vy 和 和 该 路 径 上 的 所 有 市 点 都 应 该 已 经 被 添加 到 含 u 的 树 中 。 因 此 ， 
当 且 仪 当 无 向 图 中 的 证 点 在 同一 棵 树 中 时 ， 它 们 才 是 连通 的 ， 也 就 是 说 ， 这 些 树 都 是 连通 分 支 。 


+ 示例 9.24 
再 次 考虑 图 9-4 中 的 无 向 图 。 图 9-38 展 示 了 我 们 可 以 为 该 图 构建 的 一 种 可 能 的 深度 优先 搜索 
森林 。 要 注意 这 3 棵 次 度 优先 搜索 树 是 如 何 与 3 个 连通 分 支 对 应 的 。 
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图 9-38 ”深度 优先 搜索 森林 将 无 向 图 分 为 连通 分 文 


9.7.7 ”习题 


(1) 为 图 9-37 所 示 的 图 找 出 所 有 拓扑 次 序 。 

(2)* 假 设 R 是 定义 域 D 上 偏 序 关 系 。 我 们 可 以 用 R 的 图 来 表示 R， 其 中 节点 是 D 中 的 元 素 , 而 且 只 要 uRv 
且 wzv 就 存在 弧 w 一 vo 设 Gy1 ,Vy ,… ,Vv) 是 R 的 图 的 拓扑 次 序 。 设 关系 7 是 这 样 定 义 的 , 只 要 i 三 j， 
就 有 w7yw。 证 明 下 列 命题 。 

(a) 7 是 全 序 关系 。 

(b) KR 中 的 有 序 对 是 7 中 有 序 对 的 子 集 ， 也 就 是 ，7 是 包含 了 偏 序 关系 R 的 全 序 关系 。 
(3) 对 图 9-21 所 示 的 图 (在 将 其 转换 为 对 称 的 有 向 图 之 后 ) 应 用 深度 优先 搜索 ， 找 出 其 连通 分 文 。 
(4) 考虑 含有 弧 a 一 c，b 一 a ，b 一 c ，d 一 a 和 e 一 c 的 图 。 

(a) 对 该 图 进行 环 路 测试 。 

(b) 为 该 图 找 出 所 有 的 拓扑 次 序 。 

(c) 为 每 个 节点 找 出 可 达 集 。 

(5) * 在 9.8 节 中 ， 我 们 会 考虑 找到 从 源 节 点 * 出 发 的 最 短路 径 的 一 般 问题 。 也 就 是 说 ， 如 果 从 s 到 各 个 
节点 4 的 最 短路 径 存在 ， 我 们 和 希望 弄 清 这 些 最 短路 径 的 长 度 。 如 果 是 有 回 无 环 图 ， 这 个 问题 就 要 
简单 一 些 。 给 出 算法 ,计算 有 问 无 环 图 G 中 从 节点 s 到 各 节点 wu 的 最 短路 径 的 长 度 ， 如 果 这 样 的 路 
径 不 存在 则 是 无 限 长 。 大 家 设计 的 算法 应 花费 0 (m) 的 时 间 ， 其 中 mm 是 图 G 中 节点 数 和 弧 数 的 较 大 
者 。 证 明 自 己 的 算法 具有 该 运行 时 间 。 提 示 : 首先 对 G 进 行 拓扑 排序 ， 依 次 访问 每 个 节点 。 在 访 
问 节 点 u 时 ， 根 据 已 经 计算 出 的 s 到 ww 的 前 导 的 最 短 距离 来 计算 从 sa 到 w 的 最 短 距离 。 

(6) * 为 有 向 无 环 图 G 给 出 计算 以 下 儿 项 内 容 的 算法 。 大 家 给 出 的 算法 应 该 有 0O (m) 的 运行 时 间 ， 其 中 
m 是 G 中 市 点 数 和 弧 数 的 较 大 者 ， 而 且 大 家 应 该 证 明 这 一 运行 时 间 就 是 自己 设计 的 算法 所 需要 的 。 
提示 : 对 习题 (5) 中 的 思路 加 以 改造 。 

(a) 对 每 个 节点 wu， 找到 从 wu 到 任意 节点 的 最 长 路 径 的 长 度 。 

(b) 对 每 个 节点 w， 找 到 从 任意 节点 到 wu 的 最 长 路 径 的 长 度 。 

(c) 对 给 定 的 源 节 点 se 和 G 的 所 有 节点 w， 找 到 从 s 到 wu 的 最 长 路 径 的 长 度 。 
(d) 对 给 定 的 源 节 点 se 和 G 的 所 有 节点 w， 找 到 从 wu 到 s 的 最 长 路 径 的 长 度 。 
(e) 对 每 个 节点 w， 找 到 经 过 wu 的 最 长 路 径 的 长 度 。 
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9.8 用 于 寻找 最 短路 径 的 迪 杰 斯 特 拉 算 法 


假设 有 一 幅 图 ， 它 既 可 能 是 有 向 图 也 可 能 是 无 向 图 , 它 的 弧 (或 边 ) 都 带 有 表示 弧 (或 边 ) 
的 “长 度 ” 的 标号 。 图 9-4 就 是 个 例子 , 它 展 示 了 夏威夷 群岛 的 特定 公路 的 距离 。 想 知道 两 个 市 
点 间 的 最 小 距离 是 特别 平常 的 事例 如 ， 地 图 上 通常 会 带 有 行车 距离 的 表格 ， 从 而 指示 出 人 们 
一 天 中 可 以 开 多 远 ， 或 是 有 助 于 确定 经 过 不 同 的 中 间 城 市 的 两 条 路 线 中 哪 条 更 短 。 类 似 的 问题 
会 给 每 条 弧 关 联 上 沿 着 该 弧 行 进 所 花 的 时 间 ， 或 者 可 能 关联 上 经 过 该 弧 的 开销 。 那 么 两 个 方 点 
间 的 最 小 “距离 ”就 分 别 对 应 着 出 行 的 时 间或 费用 。 

一 般 而 言 ， 路 径 的 距离 是 该 路 径 上 所 有 弧 ( 或 边 的 ) 标号 之 和 。 而 从 节点 u 到 节点 v 的 最 小 
距离 是 从 wu 到 y 的 任意 路 径 的 距离 中 最 小 的 那个 。 


+ 示例 9.25 

考虑 一 下 图 9-10 中 瓦 胡 岛 的 地 图 。 假 设想 要 找 出 从 迈 里 到 卡 内 奥 赫 的 最 小 距离 ， 有 和 蔡 干 路 
径 可 供 我 们 选择 。 有 一 个 实用 的 观点 ， 只 要 弧 的 标号 是 非 负 的， 那么 最 小 距离 路 径 中 就 绝对 不 
会 有 环 路 。 我 们 可 以 跳 过 环 路 ， 并 在 同样 的 两 个 节点 间 找 到 一 条 距离 不 超过 含 环 路 路 径 距 离 的 
路 径 。 因 此 ， 我 们 只 需要 考虑 如 下 路 径 。 

(1) 经 过 珍珠 城 和 檀香山 的 路 径 。 

(2) 经 过 瓦 西 阿 瓜 、 珍 珠 城 和 檀香山 的 路 径 。 

(3) 经 过 瓦 西 阿 瓦 和 拉 耶 的 路 径 。 

(4) 经 过 珍珠 城 、 瓦 西 阿 瓦 和 拉 耶 的 路 径 。 

这 些 路 径 的 距离 分 别 是 44、51、67 和 84。 因 此 ， 从 迈 里 到 卡 内 奥 赫 的 最 小 距离 是 44。 

如 果 想 找到 从 某 给 定 节点 ( 称 为 源 节点 ) 到 图 中 所 有 节点 的 最 小 距离 ， 可 以 使 用 的 最 有 效 
的 技巧 之 一 就 是 迪 杰 斯 特 拉 算 法 ， 这 也 就 是 本 节 的 主题 。 事 实证 明 ， 如 果 我 们 想 要 的 就 是 从 一 
个 节点 2 到 另 一 个 节点 v 的 距离 ， 最 佳 方式 就 是 以 z 为 源 节点 运行 迪 杰 斯 特 拉 算 法 ， 并 在 得 出 到 v 
的 距离 时 停止 算法 。 如 果 我 们 想 找 到 每 个 节点 对 之 间 的 最 小 距离 ， 就 要 用 到 9.9 节 中 将 要 介绍 的 
算法 ， 上 弗 洛 伊 德 算 法 ,该 算法 有 时 要 比 以 每 个 市 点 为 源 市 点 运行 迪 杰 斯 特 打算 法 更 值得 选择 。 

迪 杰 斯 特 拉 算 法 的 本 质 就 是 ， 我 们 按照 这 些 最 小 距离 从 小 到 大 的 次 序 ， 也 就 是 最 近 的 节点 
最 先 的 次 序 ， 找 到 从 源 节 点 到 其 他 节点 的 最 小 距离 。 随 着 迪 杰 斯 特 拉 算 法 的 进行 ， 就 有 了 类 似 
图 9-39 所 示 的 情形 。 在 图 G 中 ,， 存在 某 些 特定 的 节点 是 已 解决 的 , 也 就 是 说 ,它们 的 最 小 距离 是 
已 知 的 ， 这 一 集合 总 包括 源 节 点 gs。 对 未 解决 的 节点 v， 我 们 要 记录 最 短 特 殊 路 径 的 长 度 ， 所 谓 
特殊 路 径 ， 就 是 从 源 节 点 出 发 ， 只 经 过 已 解决 节点 ， 然 后 在 最 后 一 步 跳 出 已 解决 区 域 直接 到 达 v 
的 路 径 。 

我 们 要 为 每 个 节点 xie 录 dist(0 值 。 如 果 x 是 已 解决 节点 ,那么 west 就 是 从 源 节 点 到 x 的 最 短 
路 径 的 长 度 。 如 果 x 不 是 已 解决 的 , 那么 disx(o0) 就 是 从 源 节 点 到 v 的 最 短 特殊 路 径 的 长 度 。 一 开始 ， 
只 有 源 节 点 是 已 解决 的 , 而 且 dist(s)=0， 因 为 只 由 s 自 己 构成 的 路 径 的 长 度 肯 定 是 0。 如 果 存 在 从 
s 到 jw 的 弧 ， 那么 dist(w) 就 是 该 弧 的 标号 。 请 注意 ,在 只 有 s 是 已 解决 节点 时 ,特殊 路 径 只 包含 那些 
从 s 出 发 的 弧 ， 所 以 如 果 存 在 从 s 到 wu 的 弧 ，dist(w) 就 应 该 是 弧 s 一 u 的 标号 。 我 们 还 将 使 用 定义 的 
常量 INFTY， 该 常量 要 比 图 G 中 任意 路 径 的 距离 都 要 大 。INFTY 是 作为 “无 限 的 ” 值 使 用 的 ， 表 
示 尚 未 发 现 特殊 路 径 。 也 就 是 说 ， 如 果 一 开始 不 存在 弧 s 一 u， 就 有 dist(u) = INFTY。 















































406 第 9 章 ”图 数据 模型 








已 解决 节点 


一 








图 9-39 迪 杰 斯 特 拉 算 法 执行 过 程 中 的 中 间 阶 段 


现在 假设 我 们 有 些 已 解决 节点 和 一 些 未 解决 节点 ， 如 图 9-39 所 示 。 我 们 发 现 贡 点 * 是 未 解决 
的 ,但 在 所 有 未 解决 节点 中 具有 最 小 的 dist 值 。 可 以 通过 以 下 方式 “解决 ”v。 

(1) 接受 dist(v) 作 为 从 s 到 vy 的 最 小 距离 。 

(2) 对 所 有 尚未 解决 的 节点 w， 调 整 qist(w) 的 值 ， 以 表明 vy 现 在 已 解决 这 一 事实 。 

第 (2) 步 所 要 求 的 调整 如 下 所 述 。 我们 要 对 qdist(w) 的 旧 值 与 qist0W) 加 上 弧 v 一 u 的 标号 的 和 进行 
比较 ,如 果 后 者 所 述 的 和 较 小 ,就 将 dist(u) 蔡 换 为 该 和 。 如 果 不 存在 弧 v 一 u ,就 不 用 调整 qist(u)。 


+ 示例 9.26 

考虑 一 下 图 9-10 中 的 瓦 胡 岛 地 图 。 该 图 是 无 器 图 ， 不 过 可 以 假设 图 中 的 边 是 两 个 方 喇 上 的 
弧 。 设 源 节点 为 檀香山 。 那么 一 开始 ， 只 有 檀香山 是 已 解决 的 , 而 且 其 距离 为 0, 我 们 可 以 将 dist 
( 珍珠 城 ) 置 为 13 并 将 dist ( 卡 内 奥 赫 ) 置 为 11 ， 不 过 对 其 他 城市 来 说 ， 没 有 从 檀香山 出 发 到 这 
些 城市 的 弧 ， 所 以 它们 与 檀香山 的 距离 就 是 INFTY。 这 种 情形 如 图 9-40 的 第 一 列 所 示 。 距 离 值 
上 的 星 号 表示 该 节点 是 已 解决 的 。 











城 市 








檀香山 
珍珠 城 


迈 里 
瓦 西 阿 瓦 
拉 耶 
卡 内 奥 赫 








dist 的 值 
图 9-40 迪 杰 斯 特 拉 算 法 执行 过 程 中 的 各 个 阶段 
在 这 些 未 解决 节点 中 ， 具 有 最 小 距离 的 节点 现在 为 卡 内 奥 赫 ， 所 以 这 市 点 就 是 已 解决 的 。 存 
在 从 卡 内 奥 赫 到 檀香山 和 拉 耶 的 弧 。 到 檀香山 的 弧 是 派 不 上 用 场 的 , 不 过 dist( 卡 内 奥 赫 ) 的 值 11， 
加 上 从 卡 内 奥 赫 到 拉 耶 的 弧 的 标号 24， 总 共 为 35， 要 小 于 当前 dist ( 拉 耶 ) 的 值 一 一 “无 限 大 ”。 
因此 ,在 第 二 列 中 ， 我 们 已 经 把 到 拉 耶 的 距离 减 小 到 35。 而 卡 内 奥 赫 现 在 是 已 解决 节点 了 。 
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在 下 一 轮 处 理 中 , 具 最 小 距离 的 未 解决 方 点 是 珍珠 城 , 其 距离 为 13。 在 我 们 解决 珍珠 城 时 ， 
还 必须 考虑 珍珠 城 的 邻居 ， 也 就 是 迈 里 和 瓦 西 阿 瓦 。 我 们 可 以 将 到 迈 里 的 距离 减 至 33( 13 和 20 
的 和 )， 并 将 到 瓦 西 阿 瓦 的 距离 减 至 25 (13 和 12 的 和 )。 现 在 的 情况 就 如 第 (3) 列 所 示 。 

接 下 来 要 解决 的 是 瓦 西 阿 瓦 ， 其 距离 为 25， 在 当前 的 未 解决 节点 中 是 最 小 的 。 不 过 ,该 节 
点 不 允许 我 们 减少 到 其 他 节点 的 距离 ， 所 以 第 (4) 列 与 第 (3) 列 有 着 相同 的 距离 项 。 同样 ,接着 要 
解决 匹 里 ,其 距离 为 33， 不 过 它 也 不 能 减少 任何 距离 ， 所 以 第 (5) 列 的 各 距离 项 也 与 第 (4) 列 的 相 
同 。 严 格 地 说 ， 必 须 解 决 最 后 一 个 节点 ， 拉 耶 ， 不 过 最 后 一 个 节点 不 可 能 影响 到 其 他 距离 ， 所 
以 第 (5) 列 就 给 出 了 从 檀香山 到 所 有 6 个 城市 的 最 短 距离 。 
9.8.1 迪 杰 斯 特 拉 算 法 起 效 的 原因 

为 了 证 明 迪 杰 斯 特 拉 算 法 是 起 作用 的 ， 必 须 假设 弧 的 标号 都 是 非 负 的 。" 我 们 将 通过 对 的 
归纳 证 明 ， 在 存在 kf 个 已 解决 节点 时 ， 下列 命题 成 立 。 

(a) 对 每 个 已 解决 节点 wu 来 说 ，dist(w) 是 从 s 到 wu 的 最 小 距离 ， 而 且 到 w 的 最 短路 径 只 由 已 解决 
节点 组 成 。 

(b) 对 每 个 未 解决 节点 wu 来 说 ,dist(w) 是 从 s 到 wu 的 任意 特殊 路 径 的 最 小 距离 ， 如 果 不 存在 这 样 
的 路 径 则 为 INFTY。 

依据 。 对 k= 1，s 是 唯一 的 已 解决 节点 。 我 们 将 dist(s) 初 始 化 为 0， 这 满足 了 (a)。 而 对 其 他 每 
个 节点 w， 如 果 弧 s 一 u 存 在， 我 们 就 将 dist(w) 初 始 化 为 该 弧 的 标号 ， 如 果 不 存 在 就 初始 化 为 
INFTY。 因 此 ，(b) 也 得 到 满足 。 

归纳 。 现 在 假设 和 (b) 在 [个 节点 被 解决 后 还 成 立 ， 并 设 * 是 第 上 +1 个 被 解决 的 节点 。 我 们 声 
明 (a) 仍 然 成 立 ， 因 为 disx 是 从 s 到 v 的 任意 路 径 的 最 短 距 离 。 假 设 不 是 ， 根 据 归 纳 假设 的 (b) 部 分 ， 
当 有 K 个 节点 已 解决 时 ，qdisx) 是 到 * 的 任意 路 径 的 最 小 距离 ， 而 且 一 定 存在 到 距离 更 短 的 到 v 的 非 
特殊 路 径 。 如 图 9-41 所 示 ， 这 一 路 径 一 定 会 在 某 个 节点 ww〈 可 能 是 节点 8 ) 离开 已 解决 节点 ， 并 行 
向 某 个 未 解决 节点 w。 从 那里 开始 ， 该 路 径 可 能 反复 进出 已 解决 节点 ， 直 到 它 最 终 到 达 节 点 v。 



































图 9-41 假设 的 经 过 w 和 2 到 达 v 的 更 短路 径 


不 过 ，* 被 选 定 为 第 入 1 个 已 解决 节点 。 这 就 意味 着 这 时 的 Wisto) 不 会 小 于 disto)， 否 则 就 要 
选择 zx 作 为 第 寻 1 个 节点 。 根 据 归 纳 假设 的 (b) 部 分 ，Uistog) 是 到 xz 的 任意 特殊 路 径 的 最 小 距离 。 不 
过 图 9-41 中 从 s 到 w 再 到 x 的 路 径 是 条 特殊 路 径 ， 所 以 该 路 径 的 距离 至 少 为 disto0)。 因 此 ， 假 设 的 











QD 如 果 人 允许 标号 是 负 值 ， 我 们 就 可 以 找到 一 些 迪 杰 斯 特 拉 算 法 会 给 出 错误 答案 的 图 。 





408 第 9 章 ”图 数据 模型 





经 过 w 和 w 的 从 s 到 vy 的 更 短路 径 的 距离 至 少 为 dist(v)， 因 为 该 路 径 从 s 到 wu 那 部 分 的 距离 已 经 是 
dist(w) 了 ， 而 且 有 dist(w) 写 dist(v)。" 因 此 ，(a) 对 寻 1 个 节点 也 是 成 立 的 ， 也 就 是 说 ， 当 我 们 将 v 
纳入 已 解决 节点 的 行列 时 ，(a) 继 续 成 立 。 

现在 必须 证 明 当 把 * 添 加 到 已 解决 节点 中 时 ，(b) 仍 然 成 立 。 考 虑 当 把 * 深 加 到 已 解决 节点 中 
时 仍然 未 解决 的 某 个 节点 ze 在 到 v 的 最 短 特殊 路 径 上 ， 肯 定 存 在 某 倒 数 第 二 个 节点 ， 这 个 节点 
既 可 能 是 vy 也 可 能 是 其 他 某 个 节点 w。 这 两 种 可 能 如 图 9-42 所 示 。 














图 9-42 ”到 % 的 最 短 特殊 路 径 上 倒数 第 二 个 节点 是 什么 


首先 假设 倒数 第 二 个 节点 是 v。 那 么 图 9-42 中 所 示 从 s 到 v 再 到 wu 的 路 径 的 长 度 就 是 dist(v) 加 上 
弧 v 一 2 的 标号 。 

另外 ,假设 倒数 第 二 个 节点 是 其 他 某 节 点 w。 根据 归纳 假设 (a)， 从 s 到 w 的 最 短路 径 只 由 v 之 
前 的 已 解决 节点 组 成 ， 因 此 ，v 没 有 出 现在 这 条 路 径 上 。 所 以 ， 当 把 vy 添 加 到 已 解决 节点 中 时 ， 
到 uw 的 最短 特 殊 路 径 不 会 改变 。 

现在 回想 一 下 ， 当 解决 vy 时 ， 会 把 每 个 dist(w) 值 调整 为 dist(w) 的 旧 值 与 dist(y) 加 上 弧 v 一 u 的 
标号 这 两 者 中 的 较 小 者 。 前 者 表示 的 是 除 y 之 外 的 某 个 节点 w 作 为 倒数 第 二 个 节点 的 情况 ， 而 后 
者 则 是 vy 为 倒数 第 二 个 节点 的 情况 。 因 此 ，(b) 部 分 也 成 立 ， 这 样 就 完成 了 归纳 步骤 。 
9.8.2 ” 迪 杰 斯 特 拉 算 法 的 数据 结构 

现在 要 展示 迪 杰 斯 特 拉 算 法 的 一 种 高 效 实现 ， 它 利用 了 5.9 节 的 平衡 偏 序 树 结 构 。? 这 里 要 
使 用 两 个 数组 ， 一 个 是 表示 该 图 的 graph 数 组 ， 另 一 个 是 表示 偏 序 树 的 potNodes。 这 样 做 的 
目的 是 ， 对 图 中 的 各 节点 w， 都 有 一 个 与 之 对 应 的 偏 序 树 节 点 a， 其 优先 级 就 等 于 dist(w)。 不 过 ， 
和 5.9 节 不 同 的 是 ,我 们 将 按照 最 低 优 先 级 而 不 是 最 高 优先 级 来 组 织 该 偏 序 树 。 或 者 ， 我 们 可 以 
取 -dist(w) 为 4 的 优先 级 。 图 9-43 展 示 了 这 种 数据 结构 。 

我 们 用 NoDE 作 为 图 节点 的 类 型 。 和 往常 一 样 ， 将 用 从 0 开始 的 整数 为 节点 命名 ， 还 将 使 用 
POTNODE 作 为 偏 序 树 中 节点 的 类 型 。 就 像 在 5.9 节 中 那样 , 为 了 方便 , 我 们 会 假设 偏 序 树 中 的 节 
点 是 用 从 1 开始 的 整数 编号 的 。 因 此 ，NODE 和 POTNODE 类 型 就 等 同 于 int。 














(D 请 注意 ， 所 有 标号 都 非 负 的 事实 是 至 关 重 要 的 ， 如 果 不 这 样 的 话 ， 该 路 径 从 U 到 v 的 部 分 的 距离 有 可 能 为 负 值 ， 
这 样 就 会 得 到 一 条 到 v 的 更 短路 径 。 

Q@ 其 实 ， 当 弧 的 数量 要 比 节 点 数 的 平方 (也 就 是 能 达到 的 弧 的 最 大 数量 ) 小 一 些 时 ， 这 种 实现 是 唯一 的 好 方法 。 
我 们 将 在 习题 中 讨论 用 于 稠密 图 情况 的 一 种 简单 实现 。 
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graph 
dist succs. toPOT potNodes 
0 1 
u a 
a vu 
:三 站 n 
图 9-43 ”用 来 表示 对 应 迪 杰 斯 特 拉 算 法 的 图 的 数据 结构 
GRAPH 数 据 类 型 定义 如 下 
typedef struct { 
float dist; 


LIST successors; 
POTNODE toPOT ; 
} GRAPH [MAX]; 


这 里 ，MAX 是 图 中 的 节点 数 ， 而 LIST 则 是 由 cELL 类 型 的 单元 组 成 的 邻接 表 的 类 型 。 因 为 
需要 加 上 为 浮 点 数 标号 的 标签 ， 所 以 就 应 该 像 下 面 这 样 定义 CELL 类 型 
typedef struct CELL *LIST; 
struct CELL { 
NODE nodeName ; 
float nodeLabe!l; 
LIST next; 
及 
我 们 将 数据 类 型 PoT 声 明 为 图 中 节点 组 成 的 数组 
typedef NODE POT[MAX+1]; 
我 们 现在 可 以 定义 以 下 关键 数据 结构 
GRAPH graph 


POT potNodes,; 
POTNODE last; 


结构 体 数 组 graph 含 有 图 中 的 节点 ， 而 数组 potNodes 则 包含 了 偏 序 树 中 的 节点 ， 而 变量 
last 则 表示 偏 序 树 ( 存放 在 数组 potNodes [1. .1last] 中 ) 当前 的 末端 。 

直觉 上 讲 , 偏 序 树 的 结构 是 用 数组 potNodes 中 的 位 置 表示 的 ， 就 像 平常 表示 偏 序 树 那 样 。 该 
数组 中 的 元 素 让 我 们 通过 引用 回 图 本 身 来 区 分 节点 的 优先 级 。 特 别 要 说 的 是 ,在 potNodes [al 中 
放置 的 是 所 表示 图 节点 的 索引 x。 而 daist 字 段 graph ru] .dist 给 出 了 节点 a 在 偏 序 树 中 的 优先 级 。 
9.8.3 迪 杰 斯 特 拉 算 法 的 辅助 函数 

我 们 需要 符 干 辅助 函数 来 让 实现 运转 起 来 。 最 基础 的 函数 是 swap, 它 会 交换 偏 序 树 中 的 两 
个 节点 。 这 个 问题 并 不 像 5.9 节 中 的 那么 简单 。 在 这 里 ，graph 的 toPOT 字 段 必须 继续 记录 数组 
potNodes 中 的 值 ， 如 图 9-43 所 示 。 也 就 是 说 ， 如 果 graph[u] .toPOT 的 值 为 a,， 那么 还 肯定 有 
potNodes [a] 的 值 为 u。 
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swap 困 数 的 代码 如 图 9-44 所 示 。 它 接受 的 参数 包括 图 Ge、 侦 序 树 P， 以 及 偶 序 树 中 的 两 个 闻 
点 a 和 b。 这 里 将 检验 该 函数 交换 偏 序 树 a 和 5 两 项 中 的 值 并 交换 对 应 图 方 点 的 toPoT 字 段 的 工作 
留 给 读者 作为 练习 。 








void swap(POTNODE a, POTNODE b, GRAPH G, POT P) 
{ 
NODE temp; /* 用 来 交换 偏 序 树 节点 */ 


temp = P[b]; 
PLb] = Plal; 
Pla] = temp; 

G[P[a]]j .toPOT 
G[P[b]] .toPoT 


a; 
b ; 








图 9-44 ”交换 偏 序 树 中 两 个 节点 的 函数 


我 们 将 需要 让 节点 在 偏 序 树 中 上 冒 与 下 沉 ， 就 像 在 5.9 节 中 所 做 的 那样 。 其 主要 区 别 在 于 ， 
这 里 的 数组 potNodqes 中 元 素 的 值 不 是 优先 级 。 这 个 值 会 把 我 们 带 到 graph 数 组 中 的 节点 ， 而 
在 表示 该 节点 的 结构 体 中 可 以 找到 字段 aist， 它 会 告诉 我 们 优先 级 。 因 此 我 们 还 需要 辅助 曙 数 
priority 返 回合 适 节点 对 应 的 aist。 我 们 还 将 在 本 市 内 容 中 作出 如 下 假设 , 较 小 的 优先 级 会 上 
升 到 偏 序 树 的 顶端 ， 而 非 5.9 方 中 那样 是 较 大 优先 级 。 

ae bubpbleUpb 和 bubbleDowm 图 数 ， 它 们 都 是 对 $.9 节 中 同名 因数 

进行 简单 修改 后 得 到 的 。 函数 都 接受 网 GE 和 仿 序 树 P 作 为 参数 。 而 吨 数 bubbleDown 还 需要 

整数 参数 1ast， ss 











float priority(POTNODE a, GRAPH G, POT P) 


{ 
return G[P[a]] .dist; 
} 
void bubbleUp(POTNODE a, GRAPH G, POT P) 
{ 
if ((a > 1) && 
(priority(a, G, P) < priority(a/2, G, P))) { 
swap(la, a/2, G, P); 
bubbleUp(a/2, G, P); 
} 
} 
void bubbleDown (POTNODE a, GRAPH G, POT P, int last) 
POTNODE child; 
child = 2*a; 
if (child < last && 
priority(child+1, G, P) < priority(child, G, P)) 
++child; 
if (child <= last && 
priority(a, G, P) > priority(child, G, P)) { 
swap(a, child, G, P); 
bubbleDown(child, G, P, last); 
} 
} 





图 9-45 ” 偶 序 树 中 节点 的 上 冒 与 下 沉 
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9.8.4 ”初始 化 


我 们 将 假设 对 应 图 中 各 节点 的 邻接 表 已 经 创建 ,而 且 指 向 图 节点 wu 的 邻接 表 的 指针 已 经 出 现 
在 graph[u] .successors 中 。 还 要 假设 市 点 0 是 源 节点 。 如 果 接 受 图 闻 点 ;与 偏 序 树 节 点 计 1 
对 应 ， 数 组 potNodes 就 恰如其分 地 被 初始 化 为 偏 序 树 。 也 就 是 说 ， 偏 序 树 的 根 节 点 表示 图 的 
源 节 点 , 也 就 是 我 们 给 定 优先 级 0 的 节点 ,而 且 我 们 要 为 所 有 其 他 节点 给 定 优先 级 INFTY, 这 是 
定义 为 “无 限 ” 的 常量 。 





市 异常 的 初始 化 


请 注意 ， 在 图 9-46 的 第 (2) 行 中 ,我 们 将 dist [1] 以 及 所 有 其 他 距离 都 置 为 TINFTY。 接 着 
在 第 (5) 行 ， 再 将 该 距离 修正 为 0。 与 测试 每 个 i 值 以 确定 其 是 否 为 异常 情况 相 比 ， 这 种 方式 要 更 
有 具 效率 。 诚 然 ， 如 果 我 们 将 第 (2) 行 替代 为 
了 
G[i] .dist = 0; 


else 
G[i] .dist = INFTY:; 


就 可 以 消除 第 (5) 行 ， 不 过 这 样 一 来 不 仅 增加 了 代码 ， 还 会 增加 运行 时 间 ， 因 为 这 样 修 改 
就 必须 进行 n 次 测试 和 nn 次 赋值 ， 而 不 是 像 图 9-46 中 的 第 (2) 行 和 第 (5) 行 那样 只 用 进行 4+1 次 赋值 
而 不 用 进行 测试 。 





正如 我 们 将 要 看 到 的 ， 在 迪 杰 斯 特 拉 算 法 的 第 一 轮 处 理 中 ， 我 们 选择 “解决 ” 源 节 点 ， 这 
样 就 创造 了 可 以 作为 非 正 式 介 绍 中 起 始点 的 条 件 ， 其 中 源 节 点 是 已 解决 的 ， 而 且 aist [u] 只 有 
在 存在 从 源 节 点 到 xz 的 弧 时 才 不 是 无 限 长 。 初 始 化 函数 如 岁 9-46 所 示 。 正 如 本 节 中 之 前 的 函数 那 
样 ， initialize 接 受 图 和 偏 序 树 作为 参数 ,还 要 接受 指 问 整数 last 的 指针 pLast， 所 以 该 函 
数 可 以 将 pLast 初 始 化 为 M4X, 也 就 是 该 图 中 节点 的 数量 。 回 想 一 下 ，1last 表 示 的 是 与 当前 正 
使 用 的 偏 序 树 对 应 的 数组 中 最 后 一 个 位 置 。 











void initialize (GRAPH G, POT P, int *pLast); 
{ 


int 并; /* i 既 作 为 图 节点 ， 也 作为 树 节点 ，*/ 


(1) for (i = 0; i < MAX; i++) { 
(2 G[i] .dist = INFTY; 
(3) G[i] .toPOT = i+1; 
(4) P[i+1] = i; 
} 
(5) G[0] .dist = 0; 
(6) (*+pLast) = MAX; 








图 9-46 ”过 杰 斯 特 拉 算 法 的 初始 化 


请 注音 ， 偏 序 树 的 索引 是 1 到 MAX， 而 对 图 来 说 ， 这 些 索 引 就 是 从 0 到 MA4X-1。 因 此 ， 在 图 
9-46 的 第 (3) 行 和 第 (4) 行 中 ， 必 须 一 开始 就 把 图 中 的 厂 点 1 对 应 到 偏 序 树 的 节点 计 1。 
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9.8.5 迪 杰 斯 特 拉 算 法 的 实现 


图 9-47 展 示 了 过 杰 斯 特 拉 算 法 的 代码 ， 利 用 到 了 我 们 之 前 已 经 编写 的 所 有 函数 。 要 为 对 应 
偏 序 树 potNodes 以 及 带 有 指示 偏 序 树 末 端的 整数 last 的 图 graph 执 行 迪 杰 斯 特 拉 算 法 ,就 要 
初始 化 这 些 变 量 ， 然 后 调用 

Dijkstra(graph, potNodes, &last) 

消 数 Dijkstra 的 工作 原理 如 下 。 在 第 (1) 行 我 们 要 调用 initialize。 其 余 代码 ， 也 就 是 第 
(2) 行 到 第 (13) 行 是 个 循环 ， 该 循环 每 次 迭代 都 对 应 迪 杰 斯 特 拉 算 法 的 一 轮 人 处 理 ， 在 迭代 中 我 们 要 
选择 一 个 节点 v 并 将 其 解决 。 在 第 (3) 行 选择 的 节点 * 总 是 对 应 树 节 点 为 俩 序 树 根 节点 的 那个 。 在 第 
(4) 行 ， 通过 交换 v 与 偏 序 树 当前 的 最 后 一 个 节点 ,我们 把 v 从 偏 序 树 中 取出 。 第 (5) 行 其 实 是 通过 递 
减 last 将 v 删 除 。 然 后 第 (6) 行 通过 对 我 们 刚 放 置 到 根 节点 位 置 的 节点 调用 pubbleDown， 还 原 了 
偏 序 树 属性 。 事实 上 , 未 解决 节点 会 出 现在 as: 之 下 , 而 已 解决 厄 点 则 出 现在 last 及 Iast 以 上 的 位 置 。 























void Dijkstra(GRAPH G, POT P, int *pLast) 
{ 
NODE u, Vv; /* v 是 我 们 要 解决 的 节点 */ 
LIST ps; /* ps 沿 着 Vv 的 后 继 表 下 行 ，u 是 ps 
指向 的 那个 后 继 */ 


initialize(G, P, pLast); 
while ((*pLast) > 1) { 
Vv = P[1]:; 
swap(1, *pLast, G, P); 
--(*pLast); 
bubbleDown(1, G, P, *pLast); 
ps = G[v] .successors ; 
while (ps != NULL) { 
u = Ps->nodeName ; 
if (G[u .dist > G[vj .dist + ps->nodeLabel) { 
G[u .dist = G[v]j .dist + ps->nodeLabel; 
bubbleUp(G[u] .toPOT, G, P); 
} 
(13) ps = ps->next; 
} 


| 0 
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图 9-47 过 杰 斯 特 拉 算 法 的 主 也 数 
在 第 (7) 行 我 们 开始 调整 距离 ， 以 反映 * 现 在 已 被 解决 的 事实 。 指 针 zp 被 初始 化 为 指向 节点 v 
邻接 表 的 开头 。 在 第 (9) 行 把 变量 x 置 为 "的 某 一 后 继 之 后 ,我 们 在 第 (10) 行 测试 了 到 x 的 最 短 特 丈 
路 径 是 否 经 过 v。 只 要 该 数据 结构 中 由 G[ru]l .qist 表 示 的 distO) 的 旧 值 大 于 dist 思 加 上 弧 v 一 2 
标号 的 和 ， 就 有 这 一 最 短 特殊 路 径 经 过 节点 v。 如 果 这 样 ， 那 么 在 第 (11) 行 ， 将 dist(w) 置 为 新 的 
更 小 的 值 ， 并 在 第 (12) 行 调用 bubbleUp。 所 以 ， 如 果 需 要 的 话 ，wu 可 以 在 偏 序 树 中 上 升 到 反映 
其 新 优先 级 的 位 置 。 在 第 (13) 行 中 随 着 p 沿 着 v 的 邻接 表 问 下 移动 ， 该 循环 就 随 之 完成 了 。 


9.8.6” 巡 杰 斯 特 拉 算 法 的 运行 时 间 


正如 之 前 所 述 那 样 ,假设 图 具有 n 个 方 点 ， 而 且 mw 是 弧 数 与 方 点 数 的 较 大 者 。 这 里 将 会 按照 
描述 这 些 函 数 的 次 序 分 析 每 个 函数 的 运行 时 间 。 首 先 ，swap 函 数 显然 花费 0(1) 的 时 间 ， 因为 它 
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只 由 赋值 语句 组 成 。 同 样 priority 函 数 也 花费 O (1) 的 时 间 。 

bubbleUp 孙 数 是 递归 函数 ， 但 它 的 运行 时 间 是 0 (1) 加 上 对 到 根 节点 一 半 距 离 的 节点 递归 调 
用 该 函数 的 时 间 。 正 如 我 们 在 5.9 节 中 验证 过 的 ， 至 多 存在 log n 次 调用 ， 而 且 每 次 调用 需要 O (1) 
的 时 间 ， 所 以 bubbleUp 的 总 运行 时 间 就 是 0 (log n)。 同 样 ，bubbleDown 也 花费 0 (logn) 的 时 间 。 

initialize 国 数 要 花 O (n) 的 时 间 。 具 体 来 说 就 是 ， 第 (1) 行 到 第 (4) 行 的 循环 要 迭代 n 次 ， 
而 其 循环 体 每 次 迭代 要 花 O (1) 的 时 间 。 这 就 给 了 该 循环 O (n) 的 时 间 。 第 (5) 行 和 第 (6) 行 各 自贡 
献 了 O() 的 时 间 ， 不 过 我 们 在 大 O 表 达 式 中 可 以 将 其 省 略 掉 。 

现在 把 注意 力 转移 到 图 9-47 中 的 Dijkstra 函 数 上 。 设 m, 是 节点 vy 的 出 度 , 或 者 说 是 v 的 邻接 
表 的 长 度 。 我 们 首先 分 析 第 (8) 行 到 第 (13) 行 的 内 层 循 环 。 第 (9) 行 到 第 (13) 行 的 各 行 都 要 花 O (1) 
的 时 间 , 除了 第 (12) 行 对 bubbleUp 的 调用 之 外 , 我 们 论证 过 该 调用 要 花 O (logn) 的 时 间 。 因 此 ， 
该 循环 的 循环 体 要 花 O (log n) 的 时 间 。 该 循环 进行 的 次 数 等 于 vy 对 应 的 邻接 表 的 长 度 ， 之 前 已 经 
将 其 表示 为 m, 了 。 因 此 ， 第 (8) 行 到 第 (13) 行 的 循环 的 运行 时 间 可 以 表示 为 0 (1+m,ylogn)，1 这 一 
项 表示 的 是 v 没 有 后 继 ， 也 就 是 m, = 0 的 情况 ， 不 过 我 们 还 是 要 进行 第 (8) 行 的 测试 。 

现在 考虑 第 (2) 行 到 第 (13) 行 的 外 层 循 环 。 我 们 已 经 验证 过 第 (8) 行 到 第 (13) 行 了 。 第 (6) 行 调 
用 bubbleDown 需 要 的 时 间 。 而 循环 体 的 其 他 各 行 都 只 要 O(1) 的 时 间 ， 因 此 整个 循环 体 需 要 花 
上 O((1+m,) log n) 的 时 间 。 

外 层 循 环 刚 好 要 迭代 n-1 次 , 因为 last 的 范围 是 从 nn 减少 到 2。1+m, 中 的 1 这 一 项 因此 要 贡献 
1-1， 或 者 说 是 O (n) 的 时 间 。 不 过 ，m, 这 项 一 定 要 为 各 个 节点 v 相 加 ， 因 为 所 有 节点 ( 除了 最 后 
一 个 节点 ) 都 要 被 选 作 一 次 v。 因 此 ， 思 ,对 外 层 循环 所 有 和 迭代 的 总 贡献 是 O (m)， 因 为 有 
> _m, 三 m。 由 此 可 以 得 出 外 层 循 环 要 花 O (m log nn) 的 时 间 。 第 (1) 行 对 initialize 的 调用 要 
花 O(n) 的 时 间 , 不 过 可 以 将 其 省 略 。 这 样 一 来 就 得 到 迪 杰 斯 特 拉 算 法 的 运行 时 间 为 0 (mn log n)， 
也 就 是 说 ， 至 多 是 查看 图 中 的 节点 和 弧 所 花 时 间 的 log n 售 。 


9.8.7 ”习题 


(1) 按照 图 9-21 中 所 示 的 图 〈 见 9.4 节 的 习题 ) ， 找 到 从 底特律 到 其 他 城市 的 最 短 距离 。 如 果 茶 城市 是 
从 底特律 不 可 达 的 ， 则 这 个 最 小 距离 为 “无 限 ”。 

(2) 有 时 候 我 们 和 希望 计算 从 一 个 节点 到 劝 一 个 节点 遍历 的 弧 的 数量 。 例 如 ， 我 们 可 能 而 望 把 在 乘 飞 机 
或 坐 公交 车 出 行 过 程 中 的 换 乘 次 数 减 少 到 最 小 。 如 果 给 每 条 弧 标 记 上 1, 那么 最 小 距离 计算 就 会 变 
成 数 弧 的 过 程 。 为 图 9-5 中 的 图 ( 见 9.2 节 的 习题 ) 找 出 从 厄 点 a 到 达 各 市 点 所 需要 的 最 小 弧 数 。 

(3) 图 9-48a 中 有 7 个 灵 长 类 物种 以 及 它们 名 称 的 缩写 。 这 些 物 种 中 的 某 些 物种 已 知 要 先 于 其 他 物种 出 
现 , 因为 在 同一 地 点 代表 时 间 流 逝 的 不 同 地 层 中 发 现 了 它们 的 化 石 。 图 9-48b 中 的 表 给 出 的 三 元 组 
(x，y， 人 DD) 表示 物种 x 与 物种 y 是 在 同一 地 点 被 发 现 ， 不 过 x 要 比 y 早 ! 百 万 年 出 现 。 

(a) 画 出 表示 图 9-48 中 数据 的 有 向 图 , 其 中 弧 是 从 较 早 的 物种 到 达 较 晚 的 物种 , 弧 的 标号 就 表示 物 
































种 间 的 时 间 差 异 。 
(b) 以 AF 为 源 节 点 ， 对 (a) 小 题 画 出 的 图 运行 迪 杰 斯 特 拉 算 法 ,找到 AF 之 后 的 各 其 他 物种 与 它 相 差 
的 最 短 时 间 。 


(4)* 我 们 给 出 的 迪 杰 斯 特 拉 算 法 的 实现 需要 O (m log n) 的 时 间 ， 这 一 时 间 要 小 于 0 (Ko 的 时 间 ， 除 了 
弧 的 数量 接近 wr 的 情况 之 外 。 如 果 m 很 大 ， 就 可 以 谋划 男 一 种 不 需要 用 到 优先 级 队列 的 实现 ， 这 
样 在 每 一 轮 处 理 中 就 不 再 需要 O (n) 的 时 间 选 择 要 解决 的 节点 ， 而 只 需要 O (mi) 的 时 间 ， 也 就 是 与 
从 已 解决 节点 u 出 发 的 弧 的 数量 成 正比 的 时 间 , 来 更 新 dist。 得 到 的 是 一 种 0 (mn) 时 间 的 算法 。 完 善 
这 里 提出 的 思路 ， 并 为 迪 杰 斯 特 拉 算 法 的 这 种 实现 编写 C 语 言 程序 。 
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Australopithecus Afarensis (最 早 南 方 古 猿 ) AF 
Australopithecus Africanus ( 非洲 南方 古 猿 ) AA 
Homo Habilis (能 人 ) 和 
Australopithecus Robustus ( 粗壮 南方 古 猿 ) AR 
Homo Erectus ( 直立 人 ) Wh 
Australopithecus Boisei ( 饱 氏 南方 古 猿 ) AB 
Homo Sapiens ( 智 人 ) HS 

(a) 物种 及 其 缩写 
物种 1 物种 2 时 间 








HH AB 0.5 

HH AR 0.3 

AA AB 0.4 

AA AR 0.6 

AB HS 1.7 

HE HS 0.8 
(b) 物种 1 先 于 物种 2 的 时 间 


图 9-48 灵 长 类 物种 之 间 的 关系 


(5) ** 如 采 茶 些 弧 的 标号 为 负 值 ， 迪 杰 斯 特 拉 算 法 就 不 是 永远 都 能 奏效 了 。 给 出 一 幅 能 让 迪 杰 斯 特 拉 
算法 给 出 错误 最 小 距离 的 市 负 值 标号 的 图 。 

(6) ** 设 G 是 我 们 已 经 为 其 运行 过 迪 杰 斯 特 拉 算 法 并 以 某 种 次 序 解 决 了 其 中 布点 的 图 。 假 设 要 为 C 添 
加 一 条 权 为 0 的 弧 wu 一 ”， 以 形成 新 图 G'。 在 什么 情况 下 迪 杰 斯 特 拉 算 法 为 C' 解决 节点 的 次 序 与 为 
G 解 决 三 点 的 次 序 相同 ? 

(7) ** 在 本 节 中 我 们 采用 的 方法 是 把 表示 图 6G 的 数组 与 存储 整数 ( 作为 指向 其 他 数组 索引 ) 的 偏 序 树 
关联 起 来 。 另 一 种 方式 是 使 用 指向 数组 元 素 的 指针 。 使 用 指针 蔡 代 整数 索引 ， 重 新 实现 迪 杰 斯 特 
拉 算 法 。 


9.9 ”最 短路 径 的 弗 洛 伊 德 算法 


如 果 想 知道 食 n 个 节点 的 非 负 标号 图 中 所 有 节点 对 之 间 的 最 小 距离 ， 可 以 把 每 个 节点 n 作 为 
源 节点 来 运行 迪 杰 斯 特 拉 算 法 。 因 为 运行 一 次 迪 杰 斯 特 拉 算 法 所 需 的 时 间 为 0 (m log n)， 其 中 
是 节点 数 和 弧 数 的 较 大 者 , 那么 用 这 种 方式 找 出 所 有 市 点 对 之 间 的 最 小 距离 就 要 花 掉 0 (mn logn) 
的 时 间 。 此 外 ， 如 果 m 接 近 其 最 大 值 w”*”， 就 可 以 使 用 9.8 节 的 习题 (4) 中 讨论 过 的 迪 杰 斯 特 拉 算 法 
0 (nn) 时 间 的 实现 , 这 样 要 为 每 个 节点 对 都 找到 最 小 距离 , 就 需要 运行 n 次 成 为 0(n ) 时 间 的 算法 。 

还 有 一 种 找 出 所 有 节点 对 之 间 最 小 距离 的 算法 一 一 弗 洛 伊 德 算 法 。 这 种 算法 要 花 O (nm) 的 时 
间 ， 因 此 从 本 质 上 讲 不 比 迪 杰 斯 特 拉 算 法 更 好 ， 而 且 当 弧 的 数量 远 小 于 nn? 时 要 比 前 者 更 炒 。 不 
过 ， 弗 洛 伊 德 算法 是 基于 邻接 矩阵， 而 不 是 基于 邻接 表 的 ， 它 从 概念 上 讲 要 比 迪 杰 斯 特 拉 算 法 
简单 得 多 。 

弗 洛 伊 德 算法 的 本 质 是 , 依次 将 图 的 每 个 节点 wx 作为 枢纽 。 当 x 是 枢纽 时 , 我 们 会 试 着 利用 zx 
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作为 所 有 节点 对 之 间 的 中 间 节 点 ， 如 图 9-49 所 示 。 对 每 个 节点 对 ( 比方 说 是 v 和 w ) 而 言 ， 如 果 
弧 v 王 wu 和 wu 一 w 的 标号 的 和 ， 即 图 9-49 中 的 4tre， 要 小 于 当前 从 v 到 w 的 弧 的 标号 f{， 那 么 就 将 f 
替换 为 d+e。 





图 9-49 ”使 用 节点 wu 作 为 枢纽 ， 以 改善 某 些 节点 对 之 间 的 距离 


实现 弗 洛 伊 德 算 法 的 代码 片段 如 图 9-50 所 示 。 和 之 前 一 样 , 假设 节点 使 用 从 0 开始 的 整数 命 
名 ,并 且 还 是 使 用 NODE 作 为 节点 的 类 型 , 不 过 这 里 要 假设 该 类 型 为 整数 或 等 价 的 枚 举 类 型 。 我 
们 还 要 假设 有 nxn 的 数组 arc, 满足 arc[v] [w] 是 给 定 图 中 弧 v 一 w 的 标号 。 不 过 ， 对 其 对 角 
线 上 所 有 的 节点 v 来 说 ， 即 便 存在 弧 v 一 v， 也 有 arc[v] [v] = 0。 原 因 在 于 ， 从 一 个 节点 到 
其 自身 的 最 短 距离 总 是 0， 而 且 我 们 根本 不 希望 沿 着 这 些 缴 行进。 如 果 没 有 从 v 到 w 的 弧 ， 我 们 
就 让 arc [v] [w] 为 INFTY, 就 是 要 比 其 他 任意 标号 都 大 很 多 的 一 个 特殊 值 。 还 有 一 个 相似 的 数 
组 dist， 在 其 末端 存放 着 最 小 距离 ，dist [v] [w] 将 成 为 从 节点 v 到 节点 w 的 最 小 距离 。 


NODE u, Vv, WwW; 























for (v = 0; v < MAX; v++) 
for (W = 0; Ww < MAX; w++) 
dist[v] [w] = arc[v] [w] ; 
for (u = 0; u < MAX; u++) 
for (v = 0; v < MAX; v++) 
for (w= 0; Ww < MAX; w++) 
if (dist[vj[u] + dist[u] [w] < dist[v] [w] ) 
dist[vj[w] = dist[vij[u] + dist[u] [w]:; 


图 9-50” 弗 洛 伊 德 算法 
第 (1) 行 到 第 (3) 行 会 将 dist 初 始 化 为 arc。 第 (4) 行 到 第 (8) 行 构成 了 一 个 循环 ， 其 中 每 个 市 
点 u 会 依次 被 取 作 枢纽 。 对 各 枢纽 nw， 在 v 和 w 上 的 双重 循环 中 ， 我 们 考虑 了 每 个 节点 对 。 第 (7) 
行 会 测试 从 vy 经 过 u 到 达 w 是 否 比 从 v 直 接 到 w 更 近 , 如 果 是 这 样 ,那么 第 (8) 行 就 会 将 dist[v] [w] 
降低 为 从 v 到 u 的 距离 及 从 u 到 w 的 距离 之 和 。 








一 一 一 一 一 一 一 -一 、 
OOOO 
Si sn eet ee eS et Wnt pp 
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+ 示例 9.27 

考虑 一 下 9.3 节 图 9-10 中 的 图 。 使 用 0 到 5 的 数字 表示 节点 ,其 中 0 表示 拉 节 ,1 表示 卡 内 奥 赫 ， 
等 等 。 图 9-51 展 示 了 arc 和 矩阵 ,标号 INFTY 表 示 相 应 的 节点 对 之 间 没 有 边 连通 。 而 arc 和 矩阵 也 是 
qist 和 矩阵 的 初始 值 。 





沃 夏 尔 算法 

有 时 候 , 我 们 只 对 分 辨 两 个 节点 间 是 否 存 在 路 径 感 兴趣 ,而 不 去 管 最 小 距离 是 多 少 。 如 果 
这 样 ， 就 可 以 使 用 元 素 类 型 为 BOOLEAN ( 即 int ) 的 邻接 夭 阵 , 其 中 TRUE (1 ) 表示 弧 的 存在 ， 
而 FALSE (0) 表示 弧 不 存在 。 同 样 ，dqist 甜 阵 的 元 素 也 是 BOOLEAN 类 型 的 ， 其 中 TRUE 表示 问 
题 中 已 知 的 节点 间 存 在 路 径 ， 而 FALSE 表 示 它 们 之 间 不 存在 路 径 。 我 们 需要 对 弗 洛 伊 德 算 法 进 
行 的 唯一 修改 就 是 把 图 9-50 中 的 第 (7) 行 和 第 (8) 行 替换 为 

(7) if (aist[v] [w] == FALSE) 

(8) dist[v] [w] = qist[v]l[ru]l && qist[u] [w]; 

如 果 dist[v][w] 还 不 是 TRUE， 只 要 dist[v][u] 和 dist[ul][w] 都 是 TRUE， 这 两 行 代码 就 
会 把 它 置 为 TRUE。 

得 到 的 算法 名 为 沃 夏 尔 算法 (Warshall's Algorithm )， 可 以 在 O(n ) 的 时 间 内 为 含 n 个 节点 的 
图 计算 自 反 闭 包 和 传递 闭 包 。 这 一 算法 从 来 都 不 会 优 于 9.7 节 中 利用 了 深度 优先 搜索 的 O (mn) 
时 间 的 算法 。 不 过 ， 沃 夏 尔 算法 使 用 的 是 邻接 矩阵 而 非 邻接 表 ， 而且 如 果 m 接 近 n*， 它 实际 上 
会 因为 其 简单 性 而 比 乘法 的 深度 优先 搜索 更 有 效率 。 





请 注意 , 图 9-10 中 的 图 是 无 向 图 , 所 以 和 矩阵 是 对 称 的 , 也 就 是 说 arc[v] [w]=arc[w] [v]。 
如 果 图 是 有 向 图 ， 就 可 能 不 存在 这 种 对 称 性 ， 不 过 弗 洛 伊 德 算法 并 未 利用 到 对 称 性 ， 因 此 处 理 
有 向 图 或 无 向 图 都 是 可 以 的 。 












































图 9-51 arc 算 阵 ， 它 是 dist 和 矩阵 的 初始 值 


第 一 个 枢纽 是 x =0。 因 为 INFTY 与 任意 值 的 和 都 是 INFTY， 所 以 唯一 的 节点 对 vy 和 w， 两 者 
都 不 为 u。 而 且 有 dist[v][u]+dist[u][w] 小 于 INFTY 的 节点 对 ,就 是 v= 1 和 w=5，, 反之 亦 
然 。" 因 为 此 时 gist [1] [5] 是 INFTY， 我 们 就 将 dist [1] [5] 用 dist[1] [0]+dist[0][5] 
的 和 52 替 换 掉 。 同 样 ， 要 将 dist [5] [1] 替 换 为 32。 其 他 距离 都 不 能 借助 枢纽 0 得 到 改善 ， 这样 
一 来 就 得 到 如 图 9-52 所 示 的 aist 和 矩阵 。 


J 如 果 v 和 w 中 有 一 个 为 x， 就 很 容易 看 出 dist [v] [w] 永 远 不 可 能 借助 经 过 zx 而 得 到 改进 。 因 此 ， 在 查找 经 过 中 酸 
w 能 够 改进 距离 的 三 点 对 时 ， 可 以 忽略 那些 形 如 (vw，ww) 或 (4，w) 的 有 序 对 。 
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0 1 2 3 4 5 
0 0 24 INETY INETY INETY 28 
1 24 0 11 INFTY INFTY 52 
2 INFTY 11 0 13 INFTY NFTY 
3 [NF'TY NEFTY 13 0 20 12 
4 [NETY NFTY INFTY 20 0 15 
5 28 52 INFTY 12 15 0 





图 9-52 ”在 使 用 0 作为 枢纽 后 的 aist 移 阵 


现在 以 节点 1 作为 枢纽 。 在 如 图 9-52 所 示 的 当前 dist 算 阵 中 ， 市 点 1 分 别 存在 到 节点 0 ( 距 
离 24 )、 节 点 2( 距离 11 ) 和 节点 5 ( 距离 52 ) 的 非 无 限 连 接 。 我们 可 以 将 这 些 边 组 合 起 来 ， 从 而 
将 节点 0 到 节点 2 的 距离 从 INFTY 减 少 到 24+11 = 35。 还 可 以 把 节点 2 和 节点 5 之 间 的 距离 减少 到 
11+52 = 63。 请 注意 ，63 是 从 楂 香山 到 卡 内 奥 赫 ， 然 后 到 拉 耶 ， 最 后 到 瓦 西 阿 拟 的 路 径 的 距离 ， 
不 过 这 一 最 短路 线 只 经 过 了 目前 已 经 成 为 过 枢纽 的 节点 。 最 终 ， 我 们 会 发 现 经 过 珍珠 城 的 更 短 
路 线 。 当 前 的 aist 和 矩阵 如 图 9-53 所 示 。 


















































图 9-53 ”在 使 用 1 作为 枢纽 后 的 aist 和 矩阵 


现在 用 2 作为 枢纽 。 节 点 2 当前 与 节点 0 (距离 35 )、 节 点 1 (距离 11 )、 节点 3 (距离 13 ) 和 
节点 5 (距离 63 ) 之 间 存 在 非 无 限 连接 。 在 这 些 节 点 中 ， 节 点 0 和 节点 3 之 间 的 距离 可 以 改善 为 
35+13 = 48， 而 且 节 点 1 和 节点 3 之 间 的 距离 可 以 改善 为 11+13 = 24。 因 此 ， 当 前 的 aist 和 矩阵 
如 图 9-54 所 示 。 

















图 9-54 ”使 用 节点 2 作为 枢纽 后 的 aist 和 矩阵 


2 


接 下 来 ,节点 3 成 为 枢纽 。 图 9-55 展 示 了 节点 3 与 其 他 各 节点 之 间 当 前 的 最 佳 距离 。* 通 过 行 
经 节点 3， 可 以 作出 如 下 距离 上 的 改善 。 
(1) 节点 1 和 节点 $ 之 间 地 上 距离 被 减 小 到 36。 











J 读者 应 该 将 图 9-55 与 图 9-49 加 以 比较 。 后 者 展示 了 如 何在 有 向 图 的 一 般 情况 下 使 用 枢纽 节点 ， 其 中 进出 枢纽 节 
点 的 弧 可 能 有 着 不 同 标 号 。 而 图 9-55 则 利用 了 示例 图 的 对 称 性 ， 让 我 们 使 用 节点 3 与 其 他 各 节点 之 间 的 边 来 表示 
进入 节点 3 的 弧 ， 就 像 图 9-49 左 侧 那 样 ， 以 及 从 节点 3 出 发 的 弧 ， 就 像 图 9-49 右 侧 那 样 。 
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(2) 市 点 2 和 市 点 5 之 间 的 距离 被 减 小 到 25。 
(3) 方 点 0 和 市 点 4 之 间 的 距离 被 减 小 到 68。 
(4) 节点 1 和 节点 4 之 间 的 距离 被 减 小 到 44。 
(5) 方 点 2 和 市 点 4 之 间 的 距离 被 减 小 到 33。 





图 9-55 ”到 节点 3 的 当前 最 佳 距离 


当前 的 aist 和 抢 阵 如 图 9-S6 所 示 。 





图 9-56 ”使 用 节点 3 作为 枢纽 后 的 dist 和 矩阵 


使 用 节点 4 作为 枢纽 不 能 改善 任何 距离 。 当 节点 5 作为 枢纽 时 ， 我 们 可 以 改善 节点 0 和 节点 3 
之 间 的 距离 ， 因 为 在 图 9-56 中 有 

dist[0] [5] + dist[5] [3] = 40 

这 要 小 于 dist [0] [3] 的 值 48。 就 具体 的 城市 而 言 ， 这 就 相当 于 发 现 ， 从 拉 耶 出 发 经 过 瓦 
西 阿 瓦 到 珍珠 城 ， 要 比 经 过 卡 内 奥 赫 和 檀香山 到 珍珠 城 更 近 。 同 样 ， 可 以 把 节点 0 和 节点 4 之 间 
的 距离 从 68 改 善 到 43。 最 终 的 dist 和 矩阵 如 图 9-57 所 示 。 














1 2 3 4 5 
0 0 24 35 40 43 28 
1 24 0 11 24 44 36 
2 35 11 0 13 33 25 
3 40 24 13 0 20 12 
4 43 44 33 20 0 15 
5 28 36 和 23 12 15 0 





图 9-57 “最终 的 aist 和 矩阵 
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9.9.1 弗 洛 伊 德 算 法 为 何 奏效 


正如 我 们 所 见 ， 在 弗 洛 伊 德 算法 的 任何 阶段 ， 从 节点 ?到 节点 w 的 距离 都 将 是 只 由 做 过 枢纽 
的 节点 组 成 的 路 径 中 最 短路 径 的 距离 。 最 终 ， 所 有 的 节点 都 成 为 过 枢纽 ， 而 且 dist[v] [w] 存 
放 着 所 有 可 能 路 径 的 最 小 距离 。 

我 们 可 以 将 从 节点 v 到 节点 w 的 路 径 定义 为 满足 从 v 到 w 的 中 间 节 点 编号 不 大 于 kK 的 路 径 。 请 
注意 ， 并 不 需要 限制 w 或 w 一 定 是 {或 更 小 。 

k= -1 的 情况 是 个 重要 特例 。 因 为 假设 节点 的 编号 是 从 0 开始 的 ， 所 以 (-D) 路 径 是 没有 中 间 
节点 的 。 它 只 可 能 是 一 条 弧 ， 或 是 作为 0 长 度 路 径 起 止 点 的 一 个 节点 。 

图 9-58 展 示 了 Kk 路 径 的 样子 ,不 过 端点 v 和 w 既 可 以 在 k 之 上 ， 也 可 以 在 K 以 下 。 在 该 图 中 ， 线 
的 高 度 表 示 了 从 y* 到 w 的 路 径 上 各 节点 的 编号 。 











\ 
~ 编号 低 于 4 的 节点 ee 


图 9-58 ”除了 端点 ( 可 能 高 于 k) 外 ，K 路 径 上 的 节点 不 会 高 于 


+ 示例 9.28 

在 图 9-10 中 ， 路 径 0、1、2、3 是 一 条 2 路 径 。 中 间 节 点 1 和 2 都 不 大 于 2。 这 一 路 径 也 是 3 路 径 ， 
4 路 径 和 5 路 径 。 但 它 不 是 1 路 径 ， 因 为 中 间 节 点 2 大 于 1。 同 样 ， 它 也 不 是 0 路 径 或 (-1) 路 径 。 

因为 假设 节点 的 编号 是 从 0 到 z- 1， 所 以 (-1) 路 径 不 可 能 有 中 间 节 点 ， 因 此 它 一 定 是 一 条 弧 
或 一 个 节点 。 而 n =- 1 路 径 则 可 以 是 任意 路 径 ， 因 为 在 节点 编号 为 0 到 z- 1 的 图 中 , 任何 路 径 中 间 
节点 的 编号 都 不 会 大 于 n - 1。 这 里 将 通过 对 ji 的 归纳 证 明 该 命题 。 

命题 S(R)。 如 果 弧 的 标号 都 是 非 猴 的， 那么 在 图 9-50 第 (4) 行 到 第 (8) 行 的 循环 将 u 置 为 kt+1 之 
前 ，dist[v] [w] 是 从 vy 到 w 的 最 短 k 路 径 的 长 度 ， 如 果 没 有 这 样 的 路 径 ， 其 长 度 就 是 INFTY。 

依据 。 依 据 是 k= -1。 我 们 在 第 一 次 执行 该 循环 的 循环 体 之 前 将 u 置 为 0。 在 第 (1) 行 到 第 (3) 行 
中 我 们 已 经 把 ai st 初始 化 为 arc。 因 为 由 一 个 节点 构成 的 弧 和 路 径 只 有 (-D 路 径 , 所 以 依据 成 立 。 

归纳 。 假 设 S( 有 D) 成 立 ， 考 虑 wu = 夺 1 时 循环 迭代 期 间 aist [v] [w] 发 生 的 情况 。 假 设 P 是 从 * 
到 w 的 最 短 kt1 路 径 。 有 两 种 情况 ， 具 体 取 决 于 P 是 否 经 过 Kt+1 号 节点 。 

(1) 如 果 P 是 让 径 ， 也 就 是 说 P 其 实 没有 经 过 夺 1 号 节点 ， 那 么 根据 归纳 假设 ,在 经 过 次 迭 
代 之 后 dist [v] [w] 已 经 等 于 P 的 长 度 。 因 为 没有 更 短 的 (K+1) 路 径 ， 所 以 我 们 在 以 kt1 号 节点 为 
枢纽 的 这 轮 处 理 中 不 能 改变 di st [v] [w] 。 
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(2) 如 果 P 是 {t+1 路 径 ， 我 们 可 以 假设 P 只 经 过 市 点 夺 1 一 次 ， 因 为 环 路 永远 都 不 可 能 减少 距 
离 。 回 想 一 下 ， 我 们 要 求 所 有 标号 都 是 非 负 的 。 因 此 ，P 是 由 从 v 到 节点 村 1 的 夏 径 OO， 后 面 跟 
上 从 节点 夺 1 到 w 的 Kk 路径 R 组 成 的 ， 如 图 9-59 所 示 。 根 据 归 纳 假设 ，dist[v][k+1] 和 
dist[k+1] [w] 分 别 是 在 第 次 迭代 之 后 路 径 OQ 和 R 的 长 度 。 


图 9-59 (K+1) 路 径 可 以 分 为 两 条 kK 路 径 ，O 后 面 跟 上 R 


首先 要 看 到 aist [v] [kKk+1] 和 dist[k+1] [w] 在 第 +1 次 迭代 中 不 可 能 改变 。 原 因 在 于 所 
有 的 标号 都 是 非 猴 的 ,这样 所 有 路 径 的 长 度 都 是 非 猴 的 ， 因 此 图 9-50 中 第 (7) 行 的 测试 在 u ( 即 节 
点 kt1 ) 是 wv 或 w 其 中 之 一 时 一 定 会 失败 。 

所 以 ， 当 我 们 以 u = Kt1 对 任意 的 v 和 w 应 用 第 (7) 行 的 测试 时 ， 自 从 第 次 迭代 结束 之 后 
dist[v][k+1] 和 dist[k+1] [w] 的 值 就 不 青 改变 。 也 就 是 说 ， 第 (7) 行 的 测试 会 对 最 短 夏 径 的 
长 度 及 从 v 到 kt+1 和 夺 1 到 w 的 最 短 / 琵 径 长 度 之 和 进行 比较 。 在 第 (种 情况 下 ， 路 径 P 不 经 过 有 寻 1 ， 
前 者 更 短 ， 而 在 情况 (2) 中 ，P 经 过 Kt+1， 后 者 是 图 9-59 中 路 径 O 和 路 径 R 长 度 之 和 ， 因 此 要 更 短 。 

可 以 得 出 结论 : 第 寻 1 次 迭代 会 把 aist [v] [w] 置 为 对 所 有 的 节点 v 和 w 而 言 最 短 夺 1 路 径 的 
长 度 。 这 就 是 命题 SCk+1)， 所 以 我 们 得 出 了 归纳 的 结论 。 

要 完成 证 明 ， 设 上 = n-1。 也 就 是 说 ,我 们 知道 在 完成 全 部 n 次 迭代 后 ，dist [v] [w] 是 任意 
从 v 到 w 的 n-1 路 径 的 最 短 距 离 ， 这 样 就 证 明了 dist[v] [w] 是 从 v 到 w 的 任意 路 径 中 最 小 的 距离 。 


9.9.2 习题 


(1) 假设 图 9-5( 见 9.2 节 习题 ) 中 所 有 的 弧 标 号 都 为 1 ， 使 用 弗 洛 伊 德 算法 得 出 各 节点 对 间 最 短路 径 的 
长 度 。 给 出 以 每 个 节点 作为 枢纽 后 的 距离 矩阵 。 

(2) 对 图 9-5 中 的 图 应 用 沃 夏 尔 算法 , 计算 其 自 反 闭 包 和 传递 闭 包 。 给 出 以 每 个 节点 作为 枢纽 后 的 可 达 
性 矩阵 。 

(3) 使 用 弗 洛 伊 德 算法 为 图 9-21 ( 见 9.4 节 习题 ) 中 的 图 找到 各 城市 对 之 间 的 最 短 距 离 。 

(4) 使 用 弗 洛 伊 德 算 法 为 图 9-48 ( 见 9.8 节 习题 ) 中 的 各 灵 长 类 物种 找 出 它们 之 间 可 能 间隔 的 最 短 时 间 。 
(5) 有 时 我 们 想 只 考虑 有 一 条 或 多 条 弧 的 路 径 ， 而 将 单个 节点 排除 在 弧 的 范畴 之 外 。 如 何 修 改 arc 算 
阵 的 初始 化 部 分 ， 使 得 在 查找 从 节点 到 其 自身 的 最 短路 径 时 只 考虑 长 度 为 1] 或 1 以 上 的 路 径 ? 

(6)* 找 出 图 9-10 中 所 有 的 无 环 2 路 径 。 

(7)* 为 什么 当 弧 上 的 正 负 开销 都 存在 时 弗 洛 伊 德 算法 就 不 起 作用 了 ? 

(8) ** 给 出 能 找到 两 个 给 定 节点 间 最 长 无 环 路 径 的 算法 。 

(9) ** 假设 对 图 G 运 行 弗 洛 伊 德 算法 。 然 后 ， 我 们 将 弧 u 一 vv 的 标号 降 为 0， 以 构建 新 图 G'。 当 对 图 G 
和 图 G' 应 用 弗 洛 伊 德 算法 时 ， 怎 样 的 节点 gs 和 ;组 成 的 节点 对 会 使 每 一 轮 处 理 中 对 应 的 两 个 
qist[s][t] 都 相同 ? 











9.10 图 论 简介 











图 论 是 专门 研究 图 属性 的 数学 分 支 。 在 之 前 的 几 节 中 ,我们 已 经 展示 了 图 论 的 基本 定义 ， 
以 及 计算 机 科学 家 开发 的 一 些 可 以 高 效 计算 图 关键 属性 的 基础 算法 。 我 们 已 经 看 到 计算 最 短路 
径 、 生 成 树 和 深度 优先 搜索 树 的 算法 。 本 节 要 介绍 图 论 中 一 些 更 重要 的 概念 。 
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9.10.1 完全 图 


每 一 对 不 同 的 节点 之 间 都 存在 边 的 无 回 图 就 叫 作 完 全 图 。 含 7 个 节点 的 完全 图 就 叫 作 天 ,。 图 
9-60 展 示 了 从 Ki 到 Ki 的 完全 图 。 


l 


Ki K» Ks 4 
图 9-60 ”前 4 个 完全 图 


扩 中 的 边 数 是 n(n-1y2， 或 者 说 是 [” 。 想 知道 原因 ， 可 以 考虑 的 边 fu，。 可 以 选择 
个 节点 中 的 任意 一 个 作为 x， 并 从 其 余 n-1 个 节点 中 任 选 一 个 作为 »， 因 此 总 的 选择 数 为 n(n-1)。 
不 过 ,这 样 一 来 每 条 边 都 数 了 两 次 ， 一 次 是 fu， 认 ， 第 二 次 是 fy， 沁 ， 所 以 必须 在 总 选择 数 上 
除 以 2， 以 得 出 正确 的 边 数 。 

也 存在 完全 有 向 图 的 定义 。 这 种 图 具有 从 每 个 节点 到 每 个 其 他 节点 ( 包括 其 自身 ) 的 弧 。n 
个 节点 的 完全 有 向 图 有 丰 条 弧 。 图 9-61 展 示 了 含 3 个 节点 和 9 条 弧 的 完全 有 向 图 。 





图 9-61 含 3 个 节点 的 完全 有 癌 图 


9.10.2 平面 图 


如 果 可 以 将 无 向 图 的 所 有 闻 点 都 放 在 一 个 屏 医 上 ， 而 且 可 以 将 它 的 边 画 为 连续 的 线 而 没有 
边 交 又 ,就 说 该 无 向 图 是 平面 图 。 


+ ”示例 9.29 

图 9-60 中 的 K& 在 画 出 来 时 有 两 条 相交 的 对 角 边 ,。 不过, K& 是 平面 图 ,正如 我 们 看 到 的 图 9-62 
中 这 种 画 法 一 样 。 在 图 9-62 中 ， 通 过 重新 把 一 条 对 角 边 画 在 外 面 ， 就 避免 了 两 条 边 相 交 的 情况 
出 现 。 可 以 说 图 9-62 是 图 猴 的 平面 表示 ， 而 图 9-60 则 是 图 的 非 平面 表示 。 请 注意 ， 在 平面 表 
示 中 边 可 以 不 是 直线 。 
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图 9-62”K& 的 平面 表示 


在 图 9-63 中 看 到 两 种 最 简单 的 非 平面 图 ， 也 就 是 没有 任何 平面 表示 的 图 。 一 个 是 Ks;， 有 5 
个 节操 的 完全 图 。 而 男 一 个 是 Ks, 3, 它 的 形成 方式 是 ， 取 两 组 3 个 节点 ,并 用 一 组 的 各 个 节点 与 
另 一 组 的 各 个 节点 连接 ， 但 不 连接 同 组 中 的 节点 。 读 者 应 该 试 着 重 画 这 两 种 图 ， 看 看 有 没有 办 
法 使 得 任意 两 条 边 都 不 会 交 义 ,以 感受 一 下 它们 为 什么 不 是 平面 图 。 

















图 9-63 ”两 种 最 简单 的 非 平面 图 





库 拉 托 斯 基 定 理 说 过 , 任何 非 平 面 图 都 至 少 含有 这 两 种 图 中 一 种 的 “副本 ”。 不 过 , 我 们 在 
解释 副本 的 概念 时 一 定 要 小 心 一 点 ,因为 要 在 任意 的 非 平 面 图 G 中 找到 Ks 或 Ks,3 的 副本 ,可 能 必 
须要 将 图 9-63 所 示 的 某 些 边 与 图 G 中 的 路 径 关 联 起 来 。 


9.10.3 平面 性 的 应 用 


平面 性 在 计算 机 科学 中 是 举足轻重 的 。 例 如 ， 很 多 图 或 相似 的 图 表 需 要 在 计算 机 屏幕 或 纸 
上 表现 出 来 。 为 了 清楚 起 见 ， 是 需要 制 出 图 的 平面 表示 的 ， 或 者 如 果 图 不 是 平面 图 ， 就 需要 尽 
可 能 减少 交叉 边 的 数量 。 

读者 可 能 会 在 第 13 章 中 看 到 我 们 画 的 一 些 相当 复杂 的 电路 图 ， 它 们 其 实 就 是 以 门 和 线路 连 
接点 为 节点 而 且 以 线路 为 边 的 图 。 因 为 这 些 电 路 一 般 而 言 都 不 是 平面 的 ， 所 以 必须 制定 一 些 约 
定 ， 让 线路 可 以 在 不 连接 的 情况 下 交叉 ， 而 且 用 点 来 表示 线路 的 连接 。 

相关 的 应 用 涉及 集成 电路 的 设计 。 集 成 电路 ， 或 者 说 “芯片 ”， 把 第 13 章 中 讨论 过 的 那些 逻 
辑 电路 都 实物 化 了 。 它 们 不 需要 逻辑 电路 被 刻画 为 平面 表示 ， 但 存在 相似 的 限制 让 我 们 可 以 为 
边 指定 奋 王 “ 层 ",， 通常 是 3 或 4 层 。 在 第 一 层 上 ， 表示 电路 的 图 必须 有 平面 表示 ， 边 是 不 允许 有 
交叉 的 。 不 过 ,不 同 层级 上 的 边 是 可 以 交叉 的 。 


9.10.4 图 着 色 


为 图 G 着 色 的 图 着 色 问 题 就 是 给 每 个 节点 指定 一 种 “颜色 ”, 使 得 由 边 连 通 的 两 个 节点 不 会 
被 指定 相同 的 颜色 。 然 后 我 们 可 能 要 问 以 这 种 方式 为 图 着 色 需 要 多 少 种 不 同 的 颜色 。 为 图 G 着 
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色 所 需 的 最 小 颜色 数量 就 叫 作 图 G 的 色 数 ( chromatic number )， 通 常 表示 为 x(G) 。 可 以 用 不 超 
过 /种 颜色 着 色 的 图 被 称 为 可 着 [ 色 的 。 


+ 示例 9.30 

如 果 图 是 完全 图 , 那么 它 的 色 数 就 等 于 节点 的 数量 , 也 就 是 说 x(K,)=n。 要 证 明 这 一 点 很 
简单 ， 因 为 任意 两 个 节点 zx 和 v 之 间 都 是 有 边 连 通 的 ， 所 以 不 可 能 为 它们 着 上 相同 的 颜色 。 因 此 ， 
每 个 节点 都 要 有 其 自己 的 颜色 。 对 每 个 上 三 n 而 言 ，K, 痢 是 可 着 k 色 的 ， 不 过 如 果 k <n， 则 KK 不 
是 可 着 kf 色 的 。 请 注意 ， 可 以 说 Ky 是 可 着 5 色 的 ， 即 便 没 法 为 图 的 4 个 节点 用 上 所 有 5 种 颜色 。 
然而 ， 严 格 地 讲 ， 只 要 图 可 以 用 k 种 或 更 少 的 颜色 着 色 ， 而 不 是 说 刚好 可 用 k 种 颜色 着 色 ， 就 可 
以 说 图 是 可 着 k 色 的 。 

再 举 个 例子 ， 图 9-63 所 示 的 图 Rs3, 3 的 色 数 为 2。 比 方 说 可 以 把 左边 组 中 的 节点 全 着 上 红色 ， 
而 将 右边 那 组 中 的 节点 全 着 上 蓝 色 。 那 么 所 有 的 边 都 是 在 红色 和 蓝 色 节 点 间 的 。E&. 3 就 是 二 分 
图 (bipartite graph ) 的 例子 ， 也 就 是 可 以 用 两 种 颜色 着 色 的 图 。 所 有 这 样 的 图 都 可 以 把 它们 的 
节点 分 成 两 组 ， 其 中 同一 组 的 成 员 间 是 没有 边 连接 的 。 

最 后 再 举 个 例子 ， 图 9-64 中 6 节点 图 的 色 数 为 4。 要 知道 原因 ， 可 以 注意 到 中 心 的 节点 不 能 
与 其 他 任何 节点 颜色 相同 ， 因 为 它 与 所 有 市 点 都 是 连通 的 。 因 此 要 为 它 单独 使 用 一 种 颜色 ， 比 
方 说 红色 。 我 们 还 至 少 需要 两 种 别 的 颜色 来 为 环 上 的 节点 着 色 。 不 过 ， 如 果 我 们 试 着 像 图 9-64 
中 所 做 的 那样 交替 着 色 ， 比 方 着 上 蓝 色 和 绿色 ， 就 会 遇 到 问题 ， 第 五 个 节点 的 邻居 既 有 蓝 色 也 
有 绿色 ， 因 此 这 个 例子 中 就 需要 第 四 种 颜色 一 一 黄色 。 


oe 9) 
bay 


图 9-64” 色 数 为 4 的 图 








9.10.5 图 着 色 的 应 用 


找 出 一 种 好 的 图 着 色 方案 是 计算 机 科学 中 男 一 个 热门 问题 。 例如 , 在 第 1 章 的 全 书 内 容 简介 
中 ， 我 们 考虑 过 将 诬 程 分 配 到 时 间 段 中 ， 从 而 使 学 生 不 可 能 选 到 同一 时 段 上 诬 的 两 门 课程 。 这 
样 做 的 动机 是 在 安排 期 末 考 试 时 保证 学 生 不 可 能 在 同一 时 间 需 要 参加 两 科 考 试 。 我 们 可 以 画 一 
幅 节点 是 各 门 课 程 的 图 ， 其 中 如 果 有 学 生 同 时 选修 了 某 两 门 读 程 ， 在 表示 这 两 门 诗 程 的 节点 间 
就 存在 边 。 

这 样 一 来 ， 需 要 多 少 个 时 段 来 安排 考试 的 问题 就 成 了 计算 该 图 的 色 数 是 多 少 的 问题 。 所 有 
颜色 相同 的 节点 都 可 以 被 安排 在 同一 时 段 ， 因 为 它们 之 间 不 存在 边 。 反 过 来 讲 ， 如 果 有 一 套 对 
任何 学 生来 说 都 不 会 引起 时 间 冲 突 的 安排 ,那么 就 可 以 把 所 有 可 安排 在 同一 时 段 的 课程 涂 成 相 
同 的 颜色 ， 因 此 就 生成 了 一 种 颜色 数量 与 考 期 时 段 数 相同 的 图 着 色 方 案 。 

在 第 1 章 中 , 我 们 试探 过 基于 寻找 最 大 独立 集 安 排 考试 的 方法 。 这 对 寻找 为 图 着 色 的 好 方案 
来 说 也 是 一 种 合理 的 试探 。 大 家 可 能 会 期 得 可 以 为 小 到 像 图 1-1 中 5 市 点 图 那样 的 图 尝试 所 有 可 
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能 的 颜色 ， 其 实 这 是 可 以 的 。 不 过 ， 随 着 节点 数 的 增加 ,图 可 能 着 色 的 种 数 是 呈 指 数 式 增加 的 ， 
而 且 ， 在 找寻 最 少 可 外 8 颜色 的 过 程 中 ， 为 那些 非常 大 的 图 考虑 所 有 可 能 的 着 色 并 不 可 行 。 


9.10.6 


无 向 图 G 的 国 (clique ) 是 G 中 满足 每 对 节点 之 间 都 存在 边 的 所 有 节点 组 成 的 集合 。 含 K 个 节 
点 的 团 就 叫 作 Kk 点 团 ( k-clique )。 图 中 最 大 团 的 大 小 就 叫 作 该 图 的 团 数 (clique number )。 


+ 示例 9.31 

举 个 简单 的 例子 ,任意 完全 图 K, 都 是 由 全 部 n 个 节点 组 成 的 团 。 事实 上 ， 对 所 有 的 三 nn 来 
说 ,EK 都 有 Kk 点 团 ， 但 如 果 k>n， 则 没有 k 点 团 。 

图 9-64 中 的 图 有 大 小 为 3 的 团 ， 但 没有 更 大 的 团 了 。 这 些 3 点 团 都 是 三 角形 的 。 因 为 没 法 再 
将 其 他 节点 纳入 环 中 ,所 以 该 图 中 不 可 能 有 4 点 团 。 每 个 环 市 点 都 只 连接 到 其 他 3 个 节点 , 所 以 4 
点 团 必定 会 包含 环 上 的 某 个 节点 六 它 在 环 上 的 邻 届 ， 以 及 中 心 节 点 。 不 过 ，?* 在 环 上 的 邻居 之 
间 没 有 边 ， 所 以 没有 4 点 团 。 

举 个 团 的 应 用 的 例子 , 假设 不 像 岁 1-1 那 样 表示 课程 的 冲突 ， 而 是 用 两 个 节点 之 间 的 边 表示 
这 两 门 课程 没有 学 生 同 时 选择 。 如 此 ， 两 门 有 边 连 接 的 课程 可 以 在 同一 时 间 考 试 。 然 后 我 们 可 
以 查找 极 大 团 〈maximal clique )， 即 不 是 更 大 的 团 的 子 集 的 团 ， 而 且 要 为 同时 段 课程 的 极 大 团 
安排 考试 。 


9.10.7 “习题 
(1) 对 图 9-4 中 的 图 而 言 : 


(a) 色 数 是 多 少 ? 
(b) 团 数 是 多 少 ? 
(c) 给 出 一 个 最 大 团 的 例子 。 

(2) 如 果 将 (a) 图 9-5; (b) 图 9-26 中 的 图 变 成 无 加 图 ， 那 么 它们 的 色 数 各 是 多 少 ? 可 将 弧 当 作 边 。 

(3) 图 9-5 不 是 用 平面 方式 表示 的 。 该 图 是 否 为 平面 图 ?也 就 是 说 ， 能 否 重 画 该 图 ， 从 而 使 该 图 中 没有 
交叉 的 边 ? 

(4)* 与 无 向 图 相关 的 3 个 量 分 别 是 它 的 度 ( 任意 节点 的 最 大 邻居 数 ) 、 它 的 色 数 和 它 的 团 数 。 推 导 这 
3 个 量 之 间 一 定 成 立 的 不 等 关系 。 并 解释 这 些 关系 为 何 一 定 成 立 。 

(S) ** a 接受 含 n 个 的 节点 而 且 节 点 数 和 边 数 较 大 者 为 m 的 图 ， 并 在 0 (m) 的 时 间 内 能 分 辨 该 
图 是 否 为 二 分 图 ( 可 着 2 色 的 图 ) 。 

(6) * 0 64 中 的 图 一 0 其 中 环 上 的 每 
个 节点 都 只 与 其 在 环 上 的 邻居 以 及 中 心 节点 相连 。 给 出 该 图 的 色 数 ， 用 /的 丽 数 表示 。 

(7)* 对 像 在 9.5 节 中 讨 全 过 的 那样 的 无 序 无 根 树 的 色 数 有 什么 说 法 ? 

(8) ** 设 K;j 是 取 一 组 i 个 节点 以 及 男 一 组 个 节点 ， 并 把 一 组 中 各 个 节点 和 男 一 组 中 的 每 个 节点 用 边 连 
接 后 形成 的 图 。 我 们 看 到 如 果 i = /=3， 那 么 得 到 的 图 就 不 是 平面 图 。 那 么 对 什么 样 的 ; 利 /来 说 天， 
是 平面 图 ? 






































9.11 小 结 


图 9-65 中 的 表 对 我 们 在 本 章 中 解决 的 各 种 问题 、 解 决 这 些 问题 的 算法 ， 以 及 这 些 算 法 的 运 
行 时 间 进 行 了 总 结 。 在 该 表 中 ，n 是 图 中 的 节点 数 ， 而 m 是 图 中 厄 点 数 与 弧 ( 边 ) 数 之 间 的 较 大 
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者 。 除 非 男 外 标明 ， 否 则 假设 图 是 由 邻接 表 表 示 的 。 





































































































问 题 算 法 运行 时 间 

最 小 生成 树 克 鲁 斯 卡尔 算法 O(mlogn) 

检测 环 路 深度 优先 搜索 O(m) 

拓扑 排序 深度 优先 搜索 O(m) 

单一 源 可 达 性 深度 优先 搜索 O(m) 

连通 分 支 深度 优先 搜索 O(m) 

传递 闭 包 n 次 深度 优先 搜索 O(mn) 

单一 源 最 短路 径 ”使 用 偏 序 树 实现 的 迪 杰 斯 特 拉 算法 O(mlogn) 
使 用 9.8 节 习题 (4) 实 现 的 迪 杰 斯 特 拉 算 法 O(n’) 

所 有 节点 对 的 最 z 次 利用 使 用 偏 序 树 实 现 的 迪 杰 斯 特 拉 算法 O(mnlogn) 

短路 径 7 次 利用 使 用 9.8 节 习题 (4) 实 现 的 迪 杰 斯 特 拉 算 法 O(n’) 
利用 使 用 邻接 矩阵 表示 的 弗 洛 伊 德 算 法 OW 








图 9-65 ”图 算法 的 总 结 


除 此 之 外 ， 我 们 还 为 读者 介绍 了 图 论 中 最 关键 的 一 些 概念 ， 包 括 : 
口 路 径 和 最 短路 径 ; 

口 生成 树 ; 

口 深度 优先 搜索 树 和 和 森林 ; 

口 图 着 色 和 色 数 ，; 

口 团 和 团 数 ; 

口 平面 图 。 
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模式 是 具有 茶 个 可 识别 属性 的 对 象 组 成 的 集合 。 字 符 串 集合 就 是 一 类 模式 ， 比 如 C 语 言 合法 标 
识 符 的 集合 ， 其 中 每 个 标识 符 都 是 个 字符 串 ， 由 字母 、 数 字 和 下 划 线 组 成 ， 开 头 为 字母 或 下 划 线 。 
男 一 个 例子 是 由 只 含 0Oo 和 1 的 给 定 大 小 数组 构成 的 集合 ， 读 字符 的 函数 可 以 将 其 解释 为 表示 相同 符 
号 ,图 10-1 就 展示 了 全 都 可 以 解释 为 字母 A 的 3 个 7x7 数组 所 有 这 样 的 数组 就 可 以 构成 模式 “A”。 











0001000 0000000 0001000 
0011100 0010000 0010100 
0010100 0011000 0110100 
0110110 0101000 0111110 
O0111110 0111000 1100011 
1100011 1001100 1000001 
1000001 1000100 0000000 





图 10-1 模式 “A” 的 3 个 实例 


与 模式 相关 的 两 个 基本 问题 是 它们 的 定义 与 它们 的 识别 ， 这 是 本 章 以 及 第 11 章 的 主题 。 模 
式 的 识别 是 诸如 图 10-1 所 示 的 光学 字符 识别 (Optical Character Recognition，OCR ) 这 样 的 任务 
中 不 可 或 缺 的 一 部 分 。 在 某 些 应 用 中 ， 程 序 中 模式 的 识别 是 编译 过 程 ， 也 就 是 将 程序 从 一 种 语 
言 〈 比方 说 C 语 言 ) 翻译 成 另 一 种 语言 〈 比如 机 器 语言 ) 的 过 程 的 一 个 重要 部 分 。 

模式 应 用 在 计算 机 科学 中 还 有 其 他 很 多 例子 。 模 式 在 设计 用 于 组 成 计算 机 和 其 他 数字 设备 
的 电子 电路 的 过 程 中 扮演 着 关键 的 和 角色。 它们 也 可 以 用 在 文本 编辑 器 中 ， 让 我 们 可 以 查找 特定 
单词 或 特定 字符 串 集合 的 实例 ， 比 如 “字母 1f 之 后 跟着 任意 由 then 开 头 的 字符 序列 ”。 大 多 数 
操作 系统 允许 用 户 在 命令 中 使 用 模式 ， 例 如 ，UNIX 命 令 “1s *tex” 就 会 列 出 所 有 以 3 字符 序 
列 “tex” 结 尾 的 名 称 。 

人 们 围绕 着 模式 的 定义 和 识别 建立 起 了 一 套 庞大 的 知识 体系 。 这 一 理论 被 称 为 “自动 机 理 
论 ” 或 “语言 理论 ”， 而 其 基本 定义 和 技术 都 是 计算 机 科学 的 核心 部 分 。 





























10.1 本 章 主 要 内 容 


本 章 处 理 的 是 由 字符 串 集合 组 成 的 模式 ， 我 们 在 本 章 中 将 会 学 习 以 下 内 容 。 
口 “有 限 自 动机 ”是 一 种 基于 图 的 模式 指定 方式 .有 限 自 动机 又 分 为 两 种 :确定 自动 机 ( 10.2 
节 ) 和 非 确 定 自 动机 (10.3 节 )。 
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口 可 以 用 简单 的 方法 把 确定 自动 机 转换 成 识别 其 模式 的 程序 ( 10.2 节 )。 

口 可 以 利用 10.4 节 介绍 的 “ 子 集 构造 ”, 把 非 确定 自动 机 转换 成 识别 相同 模式 的 确定 自动 机 。 

口 正则 表达 式 是 种 代数 ， 用 来 描述 可 由 自动 机 描述 的 同类 模式 (10.5 节 到 10.7 节 )。 

口 正则 表达 式 可 转换 为 自动 机 ( 10.8 节 )， 反 之 亦 然 (10.9 节 )。 

我 们 还 要 在 第 11 章 中 讨论 串 模 式 ， 其 中 会 引入 一 种 名 为 “上 下 文 无 关 文法 ”的 递归 表示 法 
来 定义 模式 。 我 们 将 看 到 这 种 表示 法 可 以 描述 没 法 用 自动 机 或 正则 表达 式 表 示 的 模式 。 不 过 ， 
在 很 多 情况 下 ， 文 法 都 不 如 自动 机 或 正则 表达 式 那 样 容易 转换 为 程序 。 


10.2 ”状态 机 和 自动 机 


用 来 查找 模式 的 程序 通常 有 着 特殊 的 结构 。 我 们 可 以 在 代码 中 确定 某 些 位 置 ， 在 这 些 位 置 
可 以 得 知 与 程序 寻找 模式 实例 的 过 程 有 关 的 特殊 信息 。 我 们 将 这 些 位 置 称 为 状态 。 而 程序 的 整 
体 行为 可 以 视 作 程序 随 着 读 入 输入 从 一 种 状态 转移 到 另 一 种 状态 。 

要 让 这 些 概念 变 得 更 具体 , 可 以 考虑 一 个 具体 的 模式 匹配 问题 : “哪些 英语 单词 按 次 序 含有 
5 个 元 音字 母 ? ”要 回答 这 一 问题 , 可 以 使 用 很 多 操作 系统 中 都 能 找到 的 单词 表 。 例 如 , 在 UNIX 
系统 中 可 以 在 文件 /usr/dict/words 中 找到 这 样 的 表 ， 表 中 每 一 行 都 含有 一 个 常用 单词 。 在 
该 文件 中 ， 一 些 含 多 个 元 音字 母 的 单词 是 按 以 下 次 序 排列 的 : 

abstemious 


facetious 
sacrilegious 


我 们 来 编写 一 个 简单 的 C 语 言 程序 ， 检查 某 个 字符 串 并 确定 5 个 元 音字 母 是 否 按 次 序 出 现在 
该 字符 串 中 。 从 字符 串 的 开头 开始 ,该 程序 首先 会 查找 到 a。 我 们 会 说 该 程序 处 于 “状态 0”, 直 
到 它 发 现 一 个 a， 然 后 它 就 进入 “状态 1 ”。 在 状态 1 中 ， 它 会 查找 字母 e， 而 且 当 它 找到 一 个 之 
后 ,就 会 进入 “状态 2”。 该 程序 会 继续 按照 这 种 方式 运行 ， 直 至 到 达 查 找 字 母 u 的 “状态 4”。 如 
果 它 找到 uu， 那么 该 单词 就 是 按 次 序 含有 5 个 元 音字 母 ， 这 个 程序 就 能 进入 一 个 用 于 接受 的 “ 状 
态 5“。 不 需要 再 扫描 单词 的 其 余部 分 ， 因 为 已 经 可 知 ， 不 管 u 后 面 有 哪些 字母 ， 该 单词 都 是 满 
足 条 件 的 。 

可 以 这 样 解释 状态 i， 就 是 对 i = 0、1、……、S$， 程 序 已 经 按 次 序 遇 到 了 前 ; 企 元 音字 母 。 这 6 
个 状态 总 结 了 程序 在 从 左 到 右 扫 描 其 输入 的 过 程 中 需要 记 住 的 所 有 内 容 。 例如 , 在 状态 0 中 , 尽 
管 该 程序 在 查找 a, 但 它 不 需要 记 住 是 否 已 经 看 到 了 e。 原因 在 于 这 样 的 e 不 可 能 先 于 任何 a， 因 
此 不 能 作为 序列 aeiou 中 的 e。 

这 种 模式 识别 算法 的 核心 是 图 10-2 中 的 findchar (pp,c) 因数 。 该 困 数 的 参数 是 pb 一 一 指 
回 字 符 串 的 指针 的 地 址 ， 以 及 所 需 的 字符 c。 也 就 是 说 ，pp 是 “指向 指 回 字符 的 指针 的 指针 ”。 
消 数 findchar 会 查找 字符 c， 并 且 顺 便 会 移动 已 给 定 地 址 的 指针 ， 直 到 该 指针 指 癌 超 过 字符 c 
或 该 串 结 尾 的 位 置 。 它 返回 BOOLEAN 类 型 的 值 ， 就 是 我 们 定义 的 与 nt 相同 的 类 型 。 正 如 在 1.6 
节 中 讨论 过 的 ,我 们 预期 BooLEAN 类 型 的 值 只 有 TRUE 和 FALSE， 它 们 分 别 被 定义 为 1 和 0。 

在 第 (1) 行 ，findchar 会 检查 当前 由 pp 指示 的 字符 。 如 果 它 既 不 是 所 需 的 字符 c， 也 不 是 
C 语 言 中 标记 字符 串 末 端的 字符 “\0”， 那么 在 第 (2) 行 我 们 会 移动 pp 指向 的 该 指针 。 第 (3) 行 的 
测试 会 确定 我 们 是 否 因 为 过 历 完 该 串 而 停止 。 如 果 是 ， 就 返回 FALSE， 和 否则 前 移 该 指针 并 返 
加 TRUE。 
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#include <stdio.h> 


#define TRUE 1 
#define FALSE 0 
typedef int BOOLEAN; 


BOOLEAN findChar(char **pp, char c) 


if (findChar(&p, 'u')) 


{ 
(1) While (x**pp != C && **pp != '\0') 
(2) (*pp) ++; 
(3) if (**pp == ’\0’) 
(4) return FALSE ; 
else 荆 
(5) (*pp) ++ 
(6) return TRUE; 
} 
BOOLEAN testWord(char *p) 
{ 
/* 状态 0 */ 
(7) if (findChar(&p, 'a')) 
/* 状态 1 */ 
(8) if (findChar(&p, 'e')) 
/* 状态 2 */ 
(9) if (findChar(&p, 'i')) 
/* 状态 3 */ 
(10) if (findChar(&p, 'o')) 
/* 状态 4 */ 
(11) 
/* 状态 5 */ 
(12) return TRUE ; 
(13) return FALSE; 
} 
main() 
{ 
(14) printf("%d\n", testWord("abstemious")); 
} 





图 10-2 ”找到 带 有 子 序列 aeiou 的 单词 
在 图 10-2 中 ， 接 下 来 是 LestWord (p) 函数 ， 它 可 以 区 分 由 p 指 向 的 字符 串 是 否 按 次 序 含 有 





所 有 元 音字 母 。 该 函数 在 第 (7) 行 前 从 状态 0 开始 。 在 该 状态 中 它 在 第 (7) 行 调用 finachar， 其 


中 第 二 个 参数 是 a， 用 来 查找 字母 a。 如 果 它 找到 了 a， 





findChar 就 会 返回 TRUE。 因 此 在 第 (7) 





行 如 果 findchar 返 回 了 TRUE， 程 序 就 会 转移 到 状态 1， 其 中 在 第 (8) 行 会 对 e 进 行 相似 的 测试 ， 
从 第 一 个 a 之 后 开始 扫描 该 字符 串 。 因 此 它 会 继续 查找 元 音字 母 ， 直 到 第 (12) 行 ， 如 果 它 找到 了 








字母 u， 就 会 返回 TRUE。 如 果 有 任何 
该 行 中 testWora 会 返回 FALSE。 





个 元 音字 母 未 被 找到 ， 控 制 权 就 会 转移 到 第 (13) 行 ， 





在 


第 (14) 行 的 主 程序 会 测试 特定 的 字符 串 “abstemious”。 在 实践 中 ， 我 们 可 能 会 对 文件 中 
的 所 有 单词 反复 使 用 testword， 以 找 出 那些 按 次 序 含 有 5 个 元 音字 母 的 单词 。 


10.2.1 状态 机 的 图 表示 


我 们 可 以 把 图 10-2 中 这 种 程序 的 行为 用 图 表示 出 来 , 其 中 图 的 节点 表示 该 程序 的 各 个 状态 。 
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更 重要 的 可 能 在 于 ， 可 以 通过 设计 图 从 而 设计 出 程序 ， 并 机 械 化 地 将 图 转化 成 程序 ， 要 人 么 自己 
动手 做 ， 要 么 利用 某 种 为 这 个 目的 编写 的 程序 设计 工具 。 

表示 程序 状态 的 图 都 是 有 问 图 ， 它 们 的 弧 都 是 用 字符 集 标记 的 。 如 果 当 我 们 在 状态 s 时 ， 刚 
好 只 有 当 看 到 集合 C 中 的 一 个 字符 时 才能 行进 到 状态 + 就 存在 从 状态 s 到 状态 1 的 标号 为 字符 集 C 
的 弧 。 这 些 弧 叫 作 转换 ( transition )。 如 果 x 是 字符 集 C 中 的 某 个 字符 ， 它 标记 了 从 状态 s 到 状态 t 
的 转换 ， 就 说 “进行 了 针对 x 的 到 状态 的 转换 ”。 在 集合 C 为 单元 素 集 {x} 这 种 常见 的 情况 下 ,我 
们 会 使 用 x 作为 该 弧 的 标号 ， 而 不 用 {x}。 

我 们 还 会 给 某 些 节点 标记 接受 状态 (accepting state )。 当 到 达 这 些 状态 之 一 时 ,就 找到 了 模 
式 并 要 “接受 ” 它 。 按 照 惯 例 ， 接 受 状态 是 用 双 层 圆圈 表示 的 。 最 后 ， 这 些 节 点 之 一 会 被 指定 
为 起 始 状 态 ， 也 就 是 开始 模式 识别 过 程 所 在 的 状态 。 我 们 用 一 条 不 知道 来 自 何方 的 进入 箭头 表 
示 起 始 状 态 。 这 样 的 图 就 被 称 为 有 限 自 动机 ， 或 就 叫 自动 机 。 在 图 10-3 中 可 以 看 到 自动 机 的 一 
全 村 














图 10-3 ”识别 含 子 序 列 aeiou 的 字符 序列 的 和 月 动机 


从 概念 上 讲 ， 自 动机 的 行为 其 实 很 简单 。 可 以 想象 ， 自 动机 接收 一 列 已 知 字符 作为 输入 序 
列 。 它 从 起 始 状 态 开始 读 输 入 序列 的 第 一 个 字符 。 根 据 第 一 个 字符 的 不 同 ， 它 进行 的 转换 可 能 
是 转换 到 同一 状态 ， 也 可 能 是 转换 到 另 一 状态 。 这 种 转换 可 用 自动 机 的 图 来 表示 。 然 后 自动 机 
会 读 第 二 个 字符 ， 并 作出 合适 的 转换 ， 等 等 。 


+ 示例 10.1 

对 应 图 10-2 中 testword 函 数 的 自动 机 如 图 10-3 所 示 。 在 该 图 中 ， 我 们 使 用 了 下 面 都 要 遵守 
的 一 个 约定 , 用 硕 腊 字母 A 拉 姆 达 ) 代表 所 有 大 写字 母 和 小 写字 母 组 成 的 集合 。 还 要 用 入 -a 
这 样 的 简写 形式 表示 除 a 之 外 所 有 大 小 写字 母 组 成 的 集合 。 

节点 0 是 起 始 状态 。 针 对 除了 a 之 外 的 任意 字母 ， 我 们 都 会 保持 状态 0， 不 过 遇 到 a 就 要 进入 
状态 1。 同 样 ， 一 旦 到 达 状 态 1， 就 会 停留 在 状态 1， 除 非 看 到 e， 在 看 到 e 的 情况 下 就 要 进入 状 
态 2。 接 下 来 ， 当 看 到 i 然后 看 到 o 时 就 分 别 到 达 状 态 3 和 状态 4。 除 非 看 到 u 并 进入 唯一 的 接受 状 
态 一 一 状态 5, 否则 我 们 会 停留 在 状态 4 中 。 再 没有 任何 从 状态 5 出 发 的 转换 了 ， 因 为 我 们 不 再 检 
测 待 测 单词 的 其 余 字 符 ， 而 是 要 返回 TRUE， 声 明 我 们 已 成 功 完成 测试 。 

在 状态 0 到 状态 4 中 遇 到 空白 〈 或 其 他 非 字 母 字符 ) 也 是 没有 价值 的 ， 我 们 不 会 进行 任何 转 
换 。 在 这 种 情况 下 ， 处 理会 停止 ， 而 且 ， 因 为 我 们 现在 未 到 达 接 受 状态 ， 所 以 会 拒绝 该 输入 。 


+ 示例 10.2 

接 下 来 的 例子 来 源 于 信号 处 理 。 这 里 不 再 把 所 有 字符 作为 自动 机 可 能 接收 到 的 输入 ， 而 是 
只 允许 输入 0 和 1。 我 们 要 设计 的 这 种 特殊 自动 机 有 时 也 称 为 反弹 过 滤器 (bounce filter ), 它 接受 
0 和 1 组 成 的 序列 作为 输入 。 该 目 动 机 的 目的 就 是 “平滑 ”该 序列 ,方法 是 将 由 1 包围 的 一 个 0 当 
作 “ 噪 音 "， 并 把 这 个 0 替换 为 1。 同 样 ， 由 0 包围 的 一 个 1 也 会 被 当 作 噪声 并 被 0 替代 。 
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这 里 举 一 个 反弹 过 滤器 使 用 方式 的 例子 ， 我 们 可 以 逐 行 扫描 某 数 字 化 的 黑白 图 像 。 该 网 像 
的 每 一 行 其 实 都 是 0 和 1 组 成 的 序列 。 因 为 图 片 有 时 候 会 因 胶 片 瑕 疲 或 拍摄 问题 造成 有 一 些小 点 
颜色 错误 ， 所 以 ， 为 了 减少 图 像 中 不 同 区 域 的 数量 ， 并 让 我 们 将 精力 放 在 “真实 ”的 特色 而 非 
那些 虚假 的 特征 上 ， 消 除 这 样 的 点 是 很 实用 的 。 

图 10-4 表 示 的 就 是 对 应 该 反弹 过 滤器 的 自动 机 。 其 中 的 4 种 状态 解释 如 下 : 

(a) 我 们 已 经 看 到 至 少 在 一 行 中 含 两 个 0 的 一 列 0; 

(b) 我 们 已 经 看 到 一 列 0 后 面 跟着 一 个 1; 

(c) 我 们 已 经 看 到 至 少 有 两 个 1 的 一 列 1; 

(d) 我 们 已 经 看 到 一 列 1 后 面 跟着 一 个 0。 

状态 ca 被 指定 为 起 始 状态 ,表示 我 们 的 自动 机 进行 处 理 时 就 好 像 在 输入 之 前 有 一 个 看 不 见 的 
前 级 0 序列 那样 。 














图 10-4 ”消除 虚假 的 0 和 1 的 自动 机 


接受 状态 是 c 和 4d。 对 该 自动 机 而 言 ， 其 接受 过 程 与 图 10-3 所 示 的 自动 机 有 着 一 些 不 同 的 含 
义 。 对 图 10-3 所 示 的 自动 机 而 言 ， 在 到 达 接 受 状 态 时 ， 就 可 以 说 整个 输入 都 被 接受 了 ， 包 括 自 
动机 还 没有 读 到 的 那些 字符 。" 而 在 这 里 , 我 们 想 要 接受 状态 表述 “输出 一 个 1”, 还 要 一 个 表述 
“输出 一 个 0” 的 非 接受 状态 。 在 这 种 解释 下 ， 我 们 会 将 输入 中 的 每 一 位 都 转化 成 输出 中 的 每 一 
位 。 通 常 输出 是 和 输入 相同 的 ,不 过 有 时 候 也 会 不 同 。 例如， 图 10-5 展 示 了 输入 为 0101101 时 的 
输入 、 各 个 状态 和 它们 的 输出 。 





图 10-5 图 10-4 中 的 自动 机 处 理 输入 0101101 时 的 情况 模拟 





我 们 从 状态 ea 开始 ,因为 o 是 非 接受 状态 ,所 以 输出 0。 请 注意 ， 这 一 初始 输出 并 不 是 对 任意 
输入 的 回应 ， 而 是 表示 在 初次 开局 设备 时 自动 机 的 条 件 。 

图 10-4 中 从 状态 a 出 发 标记 了 输入 0 的 转换 是 到 达 状 态 a 自 号 的 。 因 此 第 二 个 输出 还 是 0。 第 
二 个 输入 是 1， 而 且 从 状态 a 可 以 进行 针对 1 的 到 状态 bp 的 转换 。 该 状态 “ 记 住 了 ”我 们 已 经 看 到 
过 一 个 1， 不 过 因为 是非 接受 状态 ， 所 以 输出 仍然 是 0。 针 对 第 三 个 输入 ， 也 就 是 另 一 个 0， 我 











J 不过， 通过 为 状态 5 加 一 个 所 有 字母 上 的 转换 ， 我 们 可 以 修改 该 自动 机 ， 使 其 能 继续 读 u 之 后 的 所 有 字母 。 


由 
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们 又 从 状态 5 回 到 了 状态 a， 而 且 继 续 发 出 输出 0。 

接 下 来 的 两 个 输入 都 是 1， 可 以 先 将 自动 机 带 到 状态 上 ， 然 后 带 到 状态 c。 对 这 两 个 1 中 的 第 
一 个 1, 我 们 发 现 目 己 是 在 状态 中,， 这 会 带 来 输出 0。 这 个 输出 是 错 的 ， 因 为 我 们 其 实 已 经 开始 
处 理 1 了 , 但 是 在 读 完 第 四 个 输入 后 还 不 知道 这 一 点 。 这 种 简单 设计 的 影响 在 于 , 不 管 是 0 还 是 1 
组 成 的 , 所 有 的 串 都 被 右 移 了 一 位 ,因为 在 自动 机 意识 到 它 已 经 开始 处 理 新 的 串 而 不 是 “噪声 ” 
位 之 前 , 一 行 中 已 经 接受 了 2 位 。 在 接收 第 5 个 输入 时 ,我 们 就 会 遵循 从 状态 5 到 状态 c 针 对 输入 1 
的 转换 。 在 这 一 情况 下 ， 会 得 到 第 一 个 1 输出 ， 因 为 c 是 接受 状态 。 

最 后 两 个 输入 是 0 和 1。0 把 我 们 从 状态 c 带 到 状态 d, 这 样 我 们 可 以 记得 自己 已 经 看 到 了 一 个 
0。 从 状态 4 的 输出 依然 是 1， 因 为 该 状态 是 接受 状态 。 最 后 的 1 将 我 们 带 回 状态 c 并 生成 输出 1。 




















自动 机 与 其 程序 之 间 的 区 别 


自动 机 是 种 抽象 。 从 10.3 节 起 将 会 变 得 明确 ， 通 过 确定 从 起 始 状态 到 某 个 用 相应 序列 标记 
的 接受 状态 之 间 是 否 存在 路 径 ， 自 动机 呈现 了 一 种 对 任意 输入 字符 序列 的 接受 /拒绝 决定 。 举 
例 来 说 ， 图 10-$ 表 示 的 反弹 过 滤器 自动 机 的 行为 告诉 我 们 , 该 自动 机 拒绝 e、0、01、010 和 0101 
这 些 前 级 ， 但 它 接 受 01011 、010110 和 0101101 这 几 个 前 级 ， 如 图 10-4 所 示 。 图 10-3 的 自动 机 接 
受 abstemiou 这 样 的 字符 事 ， 但 拒绝 abstemious， 因 为 从 状态 5 没 办 法 到 达 最 后 的 s。 

另 一 方面 ， 由 自动 机 创建 的 程序 能 以 多 种 方式 使 用 这 种 接受 /拒绝 决定 。 例如 ,图 10-2 中 的 
程序 使 用 了 图 10-3 所 示 的 自动 机 ,但 它 不 是 认可 标记 通 向 接受 状态 的 路 径 的 字符 事 ,， 而 是 认可 
整 行 输入 ， 也 就 是 ， 接 受 abstemious 而 非 abstemiou。 这 是 绝对 合理 的 ， 而且 反映 了 我 们 
编写 程序 测试 按 次 序 的 5 个 元 音字 母 的 方式 , 而 不 管 是 使 用 了 自动 机 或 是 其 他 的 方法 。 据 推测 ， 
只 要 我 们 到 达 字 母 u， 该 程序 就 会 打印 出 整个 单词 而 不 再 继续 检查 其 余 字 母 。 

图 10-4 所 示 自 动机 的 使 用 方式 就 更 简单 。 我 们 将 会 看 到 ， 图 10-7 中 对 应 这 一 反弹 过 滤器 的 
程序 会 直接 把 每 个 接受 状态 转化 成 打印 一 个 1 的 行动 ， 而 将 每 个 拒绝 状态 转化 成 打印 一 个 0 的 
行动 。 





10.2.2 ”习题 


(1) 设计 自动 机 ， 读 由 0 和 1 组 成 的 串 ， 并 能 进行 下 述 操 作 。 

(a) 确定 目前 位 置 读 到 的 序列 是 否 有 偶 校 验 〈 即 存在 偶数 个 1 ) 。 特 别 要 指出 的 是 ， 如 果 目 前 为 止 
该 串 有 偶 校 验 ， 则 该 自动 机 会 接受 它 ， 而 如 果 它 具有 奇 校 验 ， 自 动机 就 会 拒绝 它 。 

(b) 检验 输入 串 没有 两 个 以 上 连续 的 1。 也 就 是 说 ， 除 非 111 是 当前 为 止 读 过 的 输入 串 的 子 串 ， 否 
则 接受 。 

每 种 状态 的 直觉 含义 各 是 什么 ? 

(2) 在 给 定 输入 101001101110 时 ， 指 出 习题 (1) 中 自动 机 的 状态 序列 和 输出 。 

(3) * 设计 目 动 机 ， 读 的 是 单词 (字符 串 ) ， 并 分 状 单 词 中 的 字母 是 否 是 已 排 好 序 的 。 例 如 ，adept 
和 chilly 这 样 的 单词 中 的 字母 就 是 已 排 好 序 的 ， 而 baby 就 不 是 ， 因 为 在 第 一 个 b 后 面 有 个 a。 单 
词 一 定 是 以 空白 终止 的 ， 这 样 自动 机 才 会 在 读 完 所 有 字符 后 知道 这 一 点 。 与 示例 10.1 不 同 ， 这 里 
我 们 必须 在 读 完 所 有 字符 后 才能 接受 ， 也 就 是 说 ， 必 须 在 到 达 单 词 末端 的 空白 之 后 才能 接受 。 该 
自动 机 需要 多 少 种 状态 ?” 每 种 状态 的 直觉 含义 是 什么 ?” 从 每 种 状态 出 发 的 转换 又 有 多 少 ? 总 共 
有 多 少 种 接受 状态 ? 























10.3 确定 自动 机 和 非 确 定 自 动机 433 





(4) 设计 自动 机 ， 使 其 能 分 辨 字符 串 是 否 为 合法 的 C 语 言 标 识 符 (字母 后 跟 上 字母 、 数 字 或 下 划 线 ) 
后 跟 上 空白 。 

(5) 编写 C 语 言 程序 ， 实 现 习 题 (1) 到 习题 (4) 的 各 种 自动 机 。 

(6) 设计 自动 机 ， 使 其 能 分 辩 给 定 的 字符 串 是 否 为 第 三 人 称 单数 代词 (he、his、him、she、her 
或 hers ) 后 跟 上 空白 。 

(7) * 将 习题 (6) 设 计 的 自动 机 转换 成 C 语 言 兄 数 ， 并 在 程序 中 使 用 该 也 数 找到 某 给 定 字 符 串 中 所 有 出 
现 第 三 人 称 单数 代词 子 串 的 位 置 。 


10.3 ”确定 自动 机 和 非 确定 自动 机 


使 用 自动 机 进行 的 最 基本 的 操作 之 一 是 接受 一 系列 的 符号 mw …a ， 并 从 起 始 状 态 起 循 着 
一 条 由 标号 依次 为 这 些 符号 的 弧 组 成 的 路 径 行进 。 也 就 是 说 ， 对 i = 1、2、…、k 来 说 ，a 都 是 
集合 5S, 中 作为 路 径 上 第 条 弧 标号 的 成 员 。 构 建 这 一 路 径 及 其 状态 序列 的 过 程 就 是 自动 机 对 输入 
序列 qaqa,…ai 的 模拟 (simulating )。 可 以 说 这 一 路 径 标 号 为 aia,…a, ， 当 然 , 它 也 可 能 有 其 他 标 
号 ， 因 为 给 路 径 上 的 弧 提供 标号 的 各 集合 S, 可 能 各 自 含有 很 多 字符 。 


+ 示例 10.3 

我 们 在 图 10-5 中 进行 过 一 次 这 样 的 模拟 ， 其 中 模仿 了 图 10-4 中 的 自动 机 对 序列 0101101 的 处 
理 。 另 外 , 以 图 10-3 中 用 来 识别 单词 中 是 否 含有 序列 aeiou 的 自动 机 为 例 , 考虑 对 字符 串 adept 
的 处 理 。 

我 们 从 状态 0 中 开始 。 从 状态 0 出 发 的 转换 有 两 次 , 一 次 是 针对 字符 集 入 -a 的 转换 ， 男 一 次 
是 针对 单独 一 个 字母 a 的 。 因 为 aqept 的 第 一 个 字符 就 是 a， 所 以 要 遵循 后 一 个 转换 ， 这 把 我 们 
带 到 了 状态 1。 从 状态 1 出 发 ， 又 有 针对 入 - e 和 e 的 转换 。 因 为 第 二 个 字符 是 a, 所 以 必须 遵循 前 
一 种 转换 , 因为 A-e 包 含 除了 e 之 外 的 所 有 字母 。 这 把 我 们 再 次 留 在 状态 1 中 。 因 为 第 三 个 字母 
是 es, 所 以 要 循 着 从 状态 1 出 发 的 第 二 种 转换 , 将 我 们 带 到 状态 2。adqept 的 最 后 两 个 字母 都 在 集 
合 人 -i 中， 所 以 下 两 次 转换 都 是 从 状态 2 到 状态 2。 因 此 在 状态 2 中 就 完成 了 对 adept 的 处 理 。 
相应 的 状态 转换 序列 如 图 10-6 所 示 。 因 为 状态 2 不 是 接受 状态 ， 所 以 我 们 没有 接受 输入 adqept。 











图 10-6 ”对 10-3 中 的 自动 机 针对 输入 adept 的 模拟 





有 关 自 动机 输入 的 术语 


在 这 里 将 要 讨论 的 例子 中 ， 自 动机 的 输入 是 字符 ， 比 如 字母 和 数字 ， 而 且 将 输入 当 作 字 
符 并 将 输入 序列 当 作 字符 事 是 很 方便 的 ,我 们 在 这 里 一 般 会 使 用 这 一 术语 , 不 过 偶尔 会 将 “ 字 
符 囊 ”简称 为 “ 囊 ”。 不 过 ,在 有 些 应 用 中 ,自动 机 要 转换 的 输入 是 从 比 ASCII 字 符 集 更 广泛 
的 集合 中 选 出 的 。 例如， 编译 器 可 能 会 把 while 这 样 的 关键 词 看 作 单 个 输入 符号 ， 我们 将 这 
种 情况 用 加 粗 的 字符 束 while 表 示 。 因 此 有 时 候 我 们 会 把 这 种 单独 的 输入 称 作 “符号 ”而 非 


《> 大 大 9》 


字符 ”。 
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10.3.1 确定 自动 机 

在 10.2 节 中 讨论 过 的 自动 机 有 个 重要 的 属性 。 对 任意 状态 * 和 任意 输入 字符 x 来 说 ， 至 多 只 
有 一 种 从 状态 s 出 发 的 转换 的 标号 中 含有 x。 这 样 的 自动 机 就 称 为 确定 自动 机 。 

为 给 定 输入 序列 模拟 确定 自动 机 是 很 简单 的 。 在 任意 状态 * 中 ， 给 定 下 一 个 输入 字符 x， 考 
虑 从 s 出 发 的 每 种 转换 的 标号 。 如 果 我 们 找到 标号 含 x 的 转换 ， 那 么 该 转换 就 指向 适当 的 下 一 个 
状态 。 如 果 没 有 含 x 的 转换 , 那么 该 自动 机 就 “死机 ”了 , 而 且 不 能 再 继续 处 理 输 入 ， 就 像 图 10-3 
中 的 自动 机 在 到 达 状 态 5 后 就 会 停机 那样 ， 因 为 它 知道 自己 已 经 找到 了 子 序列 aeiou。 

将 确定 自动 机 转变 为 程序 是 很 容易 的 。 我 们 为 每 个 状态 编写 一 段 代码 。 对 应 状态 s 的 代码 会 
检查 它 的 输入 ， 并 决定 应 该 遵循 从 s 出 发 的 哪 种 转换 ( 如 果 存 在 这 样 的 转换 )。 如 果 选 定 了 从 状 
态 s 到 状态 的 转换 , 那么 必须 安排 表示 状态 t 的 代码 接着 表示 状态 s 的 代码 执行 , 可 能 是 通过 goto 
语句 来 实现 。 

+ 示例 10.4 

这 里 我 们 编写 了 一 个 对 应 图 10-4 所 示 反 弹 过 滤 避 自 动机 的 函数 bounce ()。 变量 x 是 用 来 从 
输入 中 读 字 符 的。 状态 a、b、c 和 gq 将 分 别 用 标号 a、b、c 和 gd 来 表示 ， 而 且 要 使 用 标号 finis 表 
示 程 序 的 结尾 ， 也 就 是 在 输入 中 遇 到 0 和 1 之 外 的 字符 时 会 到 达 的 地 方 。 

代码 如 图 10-7 所 示 。 例 如， 在 状态 a 中 我 们 会 打印 字符 0， 因 为 a 是 非 接 受 状 态 。 如 果 输 入 字 
符 是 90， 就 停留 在 状态 a， 而 且 如 果 输 入 字符 是 1， 就 进入 状态 b。 














void bounce() 


char xXx; 


/* 状态 a */ 

a: putchar ('0'); 
x = getchar(); 
if (x =='0') goto a; /* transition to state a */ 
if (x =='1') goto b; /* transition to state b */ 
goto finis; 


/* 状态 b */ 

b: putchar('0'); 
X = getchar() ; 
if (x == '0') goto a; /* transition to State a */ 
if (x == '1') goto c; /* transition to state c */ 
goto finis; 
/* 状态 c */ 

c: putchar ('1'); 
X = getchar() ; 
if (x == '0') goto d; /* transition to state d */ 
if (x == '1') goto cj /* transition to State C */ 
goto finis; 


/* 状态 Q */ 

d: putchar ('1'); 
x = getchar() ; 
if (x =='0') goto a; /* transition to state a */ 
if (x == '1') goto c; /* transition to state c */ 
goto finis; 





图 10-7 实现 图 10-4 中 确定 自动 机 的 函数 
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在 “自动 机 ”的 定义 中 没有 要 求 从 茶 给 定 状 态 出 发 的 转换 的 标号 必须 是 不 相交 的 ， 如 果 
集合 没有 相同 的 成 员 则 说 它们 是 不 相交 的 ， 即 它们 的 交集 为 空 。 如 果 有 图 10-8 所 示 的 这 种 图 ， 
其 中 针对 输入 x 有 从 状态 s 到 状态 t 和 状态 u 的 转换 ,这样 一 来 该 日 动机 要 如 何 用 程序 来 实现 就 不 
是 很 清楚 了 。 也 就 是 说 ， 在 执行 对 应 状态 s 的 代码 时 ， 如 有 果 发 现 x 是 下 一 个 输入 字符 ， 就 得 知 
接 下 来 一 定 要 进入 表示 状态 1 的 代码 的 开头 ， 而 且 还 要 进入 表示 状态 wu 的 代码 的 开头 。 因 为 程 
序 一 次 不 能 到 达 两 个 位 置 ， 所 以 要 如 何 模 拟 从 状态 出 发 的 转换 具有 相同 标号 的 自动 机 是 很 不 
明明 的 。 

















图 10-8 从 状态 出 发 的 针对 输入 x 的 非 确定 转换 


10.3.2 ” 非 确定 自动 机 


非 确定 自动 机 可 以 具有 从 茶 一 状态 出 发 的 包含 相同 符号 的 两 个 或 多 个 转换 ， 但 这 不 是 必须 
的 。 请 注意 ,严格 地 讲 ， 确 定 目 动机 也 是 一 种 非 确定 自动 机 ， 它 只 是 刚好 没有 针对 同一 符号 的 
多 种 转换 。 一 般 来 说 “自动 机 ”都 是 不 确定 的 ， 不 过 我 们 在 强调 自动 机 不 是 确定 自动 机 时 还 是 
会 使 用 “ 非 确定 自动 机 ”的 说 法 。 

正如 上 文 提 过 的 ， 非 确定 自动 机 不 能 直接 用 程序 实现 ， 不 过 它们 对 这 里 将 要 讨论 的 奋 干 应 
用 来 说 是 很 实用 的 概念 工具 。 此 外 ， 通 过 利用 10.4 节 中 将 要 介绍 的 “ 子 集 构造 "， 可 以 将 任意 非 
确定 自动 机 转换 成 接受 相同 字符 串 集合 的 确定 自动 机 。 


10.3.3” 非 确定 自动 机 的 接受 


在 我 们 试图 模拟 针对 输入 字符 串 wa …ax 的 非 确 定 自动 机 时 ， 可 能 发 现 同一 个 字符 是 多 条 
路 径 的 标号 。 习 惯 上 讲 ， 如 有 果 至 少 有 一 条 由 某 输 入 编辑 的 路 径 可 以 通 向 接受 状态 ,就 可 以 说 非 
确定 自动 机 接受 这 一 输入 字符 串 。 以 接受 状态 结尾 的 那 一 条 路 径 ， 要 比 任意 数量 以 非 接受 状态 
结尾 的 路 径 更 重要 。 























不 确定 性 和 猜测 


认为 不 确定 性 让 自动 机 可 以 “猜测 ”是 种 看 待 不 确定 性 的 实用 方式 。 如 果 我 们 不 知道 在 某 
给 定 状态 中 要 对 某 给 定 的 输入 字符 做 什么 ,就 可 以 对 下 一 个 状态 做 出 若干 选择 。 因 为 由 带 向 接 
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受 状态 的 字符 串 标记 的 任意 路 径 会 被 解释 为 接受 ,所 以 非 确定 自动 机 其 实 被 赋予 了 进行 一 次 正 
确 猜测 的 信用 ， 而 不 管 它 还 会 造成 多 少 次 错误 猜测 。 





+ 示例 10.5 

反 性 别 歧视 言论 联盟 ( League Against Sexist Speech，LASS ) 希望 找到 含 单词 man 的 性 别 歧 
视 文 字 。 他 们 不 止 想 捕 获 ombudsman ( 特派 员 ) 这 样 的 构 词 ， 还 希望 捕获 诸如 maniac ( 狂人 ) 
或 emancipate( 解放 ) 这 样 形式 更 为 微妙 的 皮 视 。LASS 计 划 设 计 一 个 使 用 自动 机 的 程序 ， 该 程 
序 会 扫描 字符 串 ， 并 会 在 它 从 输入 中 任意 位 置 找到 字符 串 man 时 “接受 ”该 输入 。 


A—m 








A—n 
图 10-9 可 识别 大 多 数 〈 而 非 全 部 ) 以 man 结 尾 的 字符 串 的 确定 自动 机 


大 家 可 能 首先 会 尝试 如 图 10-9 所 示 的 确定 上 自动 机 。 在 该 自动 机 中 , 状态 0, 也 就 是 起 始 状 态 ， 
表示 的 是 我 们 还 没 看 到 man 这 几 个 字母 时 的 情况 。 状 态 1 是 用 来 表示 我 们 已 经 看 到 m 的 情形 ， 在 
状态 2 中 我 们 已 经 识别 了 ma ， 而 在 状态 3 中 我 们 已 经 看 到 了 man。 在 状态 0、 状 态 1 和 状态 2 中 ， 如 
果 我 们 没有 看 到 想 找 的 字母 ， 就 回 到 状态 0 并 再 次 尝试 。 

不 过 ,图 10-9 并 不 能 很 正常 地 完成 处 理 。 在 处 理 command 这 样 的 输入 时 ， 当 它 读 c 和 o 时 会 
停留 在 状态 0 中 。 在 读 第 一 个 m 时 它 会 进入 状态 1， 不 过 第 二 个 m 又 会 把 它 带 回 状态 0， 随 后 它 就 
无 法 离开 状态 0 了 。 

可 以 正确 识别 内 骸 了 man 的 字符 串 的 非 确 定 自动 机 如 图 10-10 所 示 。 关 键 的 革新 在 于 ， 我们 
在 状态 0 中 会 猜测 m 是 否 标 志 着 man 的 开始 。 因 为 该 自动 机 是 非 确 定 自 动机 , 它 允 许 同 时 猜测 “是 
(由 从 状态 0 到 状态 1 的 转换 表示 ) 和 “和 否 ”( 由 可 以 对 包括 m 在 内 的 所 有 字母 执行 从 状态 0 到 状态 0 
的 转换 这 一 事实 表示 )。 因 为 非 确定 自动 机 的 接受 需要 的 不 过 是 一 条 通 癌 接 受 状态 的 路 径 , 所 以 
我 们 可 以 受益 于 这 两 种 猜测 。 




















图 10-10 可 识别 所 有 以 man 结 尾 的 字符 串 的 非 确定 自动 机 


图 10-11 展 示 了 图 10-10 中 的 非 确定 自动 机 在 处 理 输入 字符 串 commanq 时 的 行动 。 在 回应 < 
和 o 时 ， 该 自动 机 只 能 停留 在 状态 0 中 。 在 输入 第 一 个 m 时 ， 上 自动 机 可 以 选择 进入 状态 0 或 状态 1， 
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因此 它 同 时 进入 了 这 两 个 状态 。 在 处 理 第 二 个 m 时 ， 从 状态 1 是 没 办 法 继续 行进 的 ， 所 以 该 分 支 
就 成 了 一 条 “和 死路"。 不 过 ， 从 状态 0 可 以 再 次 进入 状态 0 或 状态 1, 这 里 又 同时 进入 这 两 种 状态 。 
当 输 入 a 时 ， 可 以 从 状态 0 到 达 状 态 0， 并 从 状态 1 到 达 状 态 2。 同 样 ， 在 输入 n 时 ， 可 以 从 状态 0 
到 达 状 态 0， 并 且 从 状态 2 到 达 状 态 3。 





(1 


1 1 o> 2 一 3 


图 10-11 模拟 图 10-10 中 的 非 确定 上 自动 机 处 理 输 入 串 commanq 的 情况 


因为 状态 3 是 接受 状态 ， 所 以 在 该 点 处 我 们 可 以 接受 这 一 输入 。" 对 接受 状态 而 言 ， 在 看 到 
cormman 后 也 处 在 状态 0 中 这 一 事实 是 无 关 紧 要 的 。 最 后 的 转化 是 针对 输入 aq 的 ， 从 状态 0 到 状态 
0。 请 注意 状态 3 不 会 针对 任意 输入 行进 到 任何 位 置 ， 所 以 该 分 文 也 完结 了 。 

还 要 注意 ,网 10-9 中 展示 的 用 来 处 理 未 接收 到 单词 man 后 一 个 字符 这 种 情况 的 回 到 状态 0 的 
转换 ,在 图 10-10 中 是 不 必要 的 , 因为 在 图 10-10 中 我 们 看 到 输入 man 时 不 一 定 要 沿 着 序列 从 状态 
0 到 状态 1 再 到 状态 2 最 后 到 状态 3。 因 此 ， 虽 然 状 态 3 看 起 来 “已 死 ”， 而 且 在 看 到 man 时 已 终止 
计算 ,但 是 我 们 在 看 到 man 时 也 停留 在 状态 0 中 。 该 状态 允许 我 们 在 处 理 manoman 这 样 的 输入 时 ， 
于 读 第 一 个 man 期 间 停留 在 状态 1 中 , 并 在 读 第 二 个 man 时 行经 状态 1、 状 态 2 和 状态 3， 以 此 来 接 
受 manoman 这 样 的 输入 。 

当然 ， 图 10-10 的 设计 尽管 很 动人 ， 但 不 能 直接 转换 为 程序 。 我 们 将 在 10.4 节 中 看 到 如 何 把 
图 10-10 转 换 成 只 含 4 个 状态 的 确定 自动 机 。 与 图 10-9 不 同 的 是 ， 该 确定 自动 机 可 以 正确 地 识别 
所 有 出 现 man 的 单词 。 

尽管 可 以 把 任意 非 确 定 自动 机 转换 成 确定 自动 机 , 但 并 非 总 是 像 图 10-10 所 示 的 情况 这 般 笠 
运 。 在 图 10-10 中 的 情况 下 , 可 以 看 到 对 应 的 确定 自动 机 的 状态 不 会 多 于 原 非 确定 自动 机 的 状态 ， 
也 就 是 各 有 4 个 状态 。 但 事实 上 , 还 存在 男 外 一 些 非 确 定 自动 机 , 与 它们 对 应 的 确定 自动 机 会 含 
有 更 多 状态 。 一 个 仿 n 种 状态 的 非 确 定 自动 机 有 可 能 只 能 转换 成 含 2" 个 状态 的 确定 自动 机 。 下 一 
个 示例 正好 就 是 确定 自动 机 的 状态 要 比 非 确定 自动 机 的 状态 多 得 多 的 情况 。 因 此 ， 对 同一 个 问 
题 而 言 ， 设 计 非 确定 自动 机 可 能 比 设计 确定 自动 机 简单 得 多 。 


+ 示例 10.6 

当 本 书 作者 之 一 Jeffrey D.Ullman 之 子 Peter Ullman 上 四 年 级 时 , 他 的 一 位 老师 试图 通过 为 学 
生 们 布置 一 些 “ 部 分 换 位 构 词 ”问题 来 增加 他 们 的 词汇 量 。 该 老师 每 周 会 给 学 生 们 布置 一 个 单 
词 ， 并 要 求 他 们 找 出 使 用 该 单词 的 一 个 或 多 个 字母 可 以 构成 的 所 有 单词 。 

有 那么 一 周 ， 该 老师 布置 的 单词 是 Washington， 本 书 的 两 位 作者 聚 在 一 起 ， 决 定 进 行 一 次 
穷 举 查 找 ， 看 看 到 底 可 能 形成 多 少 个 单词 。 利 用 /usr/dict/words 文 件 与 含 3 个 步骤 的 过 程 ， 
我 们 找到 了 269 个 单词 ， 其 中 有 以 下 5 个 含 7 个 字母 的 单词 : 
































J 请 注意 ， 图 10-10 中 的 自动 机 就 像 图 10-3 中 的 自动 机 那样 ， 在 看 到 它 查 找 的 模式 时 就 会 接受 ， 而 不 是 在 单词 的 结 
尾 接 受 。 当 我 们 最 终 把 图 10-10 转 换 成 确定 自动 机 时 ， 就 可 以 根据 它 设计 能 打印 整个 单词 的 程序 了 ， 就 像 图 10-2 
中 的 程序 那样 。 
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agonist 
goatish 
showing 
vashing 
wasting 


为 字母 的 大 小 写 对 本 问题 来 说 不 重要 ， 所 以 第 一 步 就 是 要 把 词典 中 所 有 的 大 写字 母 全 部 
转化 为 小 写字 母 。 执 行 这 一 任务 的 程序 是 很 简单 的 。 














第 二 步 是 选取 只 含 来 自 集合 S={a，g，h，i，n，o0，s ,七 ，w} 中 的 字母 (washington 
中 的 字母 ) 的 单词 。 图 10-12 中 的 确定 自动 机 就 能 完成 该 任务 。newline 字 符 是 
/usr/dict/words 中 标记 行 尾 的 字符 。 如 果 我 们 遇 到 newline 之 外 的 其 他 任意 字符 ， 就 不 用 
进行 转换 ， 而 且 自 动机 决 不 会 到 达 接 受 状态 1。 如 果 在 只 读 到 washington 中 的 字母 后 过 到 
newline， 就 进行 从 状态 0 到 状态 1 的 转换 并 接受 该 输入 。 





图 10-12 ”检测 由 washington 中 出 现 的 字母 所 构成 单词 的 自动 机 


图 10-12 中 的 自动 机 接受 hash 这 样 的 单词 ， 也 就 是 相应 字母 出 现 的 次 数 多 于 washington 
本 身 中 字母 出 现 次 数 的 单词 。 因 此 , 我 们 的 第 三 步 也 是 最 后 一 步 就 是 ， 排 除 那 些 包 含 3 个 或 更 多 
n, 或 是 包含 两 个 或 更 多 S 中 其 他 字符 的 单词 。 这 一 任务 也 可 以 由 自动 机 来 完成 。 例如， 图 10-13 
中 的 自动 机 接受 的 是 至 少 有 两 个 a 的 单词 。 我 们 会 停留 在 状态 0 中 ， 直 至 看 到 a， 在 这 种 情况 下 
就 进入 状态 1。 接 着 会 保持 状态 1， 直 到 看 到 第 二 个 a， 才 进入 状态 2 并 接受 该 输入 。 该 自动 机 接 
受 那些 因为 有 太 多 a 而 不 能 用 washington 部 分 换 位 构 词 得 到 的 单词 。 在 这 种 情况 下 , 我 们 想 要 
的 刚好 是 那些 在 处 理 过 程 中 从 不 会 让 自动 机 进入 接受 状态 2 的 单词 。 


人 一 a 人 一 a 
人 
图 10-13 ”如 果 输 入 存在 两 个 a 就 接受 该 输入 的 自动 机 


图 10-13 所 示 的 自动 机 是 确定 自动 机 。 不 过 ， 它 只 表示 了 某 单词 可 被 图 10-12 中 的 自动 机 接 
受 却 仍 不 是 washington 经 部 分 换 位 构 词 得 到 的 单词 的 9 种 原因 之 一 ,要 接受 具有 washington 
中 某 个 字母 太 多 实例 的 全 部 单词 ， 我 们 可 以 使 用 图 10-14 中 的 非 确定 自动 机 。 

图 10-14 从 状态 0 中 开始 , 而且 它 针对 任意 字母 的 一 种 选择 就 是 留 在 状态 0 中 。 如 果 输 入 字符 
是 washington 中 的 任意 一 个 字母 ， 就 有 男 一 种 选择 ; 该 自动 机 还 会 猜测 它 应 该 转换 到 这 样 一 
个 状态 ， 该 状态 的 功能 是 记 住 该 字母 已 经 出 现 过 一 次 。 例 如 ， 针 对 字母 1， 我 们 有 进入 状态 7 的 
选择 。 然 后 我 们 就 会 留 在 状态 7 中 ， 直 到 看 到 男 一 个 i， 从 而 进入 作为 接受 状态 之 一 的 状态 8。 回 
想 一 下 ， 在 该 自动 机 中 ， 接 受 就 意味 着 输入 字符 串 不 是 由 washington 经 过 部 分 换 位 构 词 得 到 
的 单词 ， 在 这 里 描述 的 情况 中 就 是 因为 该 单词 含有 两 个 i。 
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因为 在 washington 中 有 两 个 n， 所 以 对 n 的 处 理 有 些 不 同 。 自 动机 在 看 到 一 个 n 后 会 进入 
状态 9， 而 在 看 到 第 二 个 n 后 会 进入 状态 10， 接 着 在 看 到 第 三 个 n 时 才 进 入 接受 状态 11。 
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图 10-14 检测 含有 一 个 以 上 的 a、g、h、i、o、s、t 或 w， 或 者 两 个 
以 上 n 的 单词 的 非 确 定 自动 机 


440 ”第 10 章 模式、 自动 机 和 正则 表达 式 





例如 ， 图 10-15 展 示 了 读 输 入 字符 串 shining 之 后 的 所 有 状态 。 因 为 我 们 在 读 第 二 个 i 后 会 
进入 接受 状态 8， 所 以 shining 不 是 由 washington 经 过 部 分 换 位 构 词 得 到 的 单词 ， 即 便 它 因 
为 只 含有 washington 中 可 以 找到 的 字母 而 能 被 图 10-12 中 的 自动 机 接受 。 
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图 10-15 图 10-14 中 的 非 确 定 自 动机 处 理 输入 字符 串 shining 时 进入 的 状态 


总 结 下 来 ,我们 的 算法 由 以 下 3 步 组 成 。 

(1) 首先 将 词典 中 的 所 有 大 写字 母 转换 成 小 写字 母 。 

(2) 找到 10-12 中 的 自动 机 接受 的 所 有 单词 ， 这 些 单词 只 由 washington 中 的 字母 组 成 。 

(3) 从 步骤 (2) 得 到 的 单词 中 删除 图 10-14 中 非 确定 自动 机 接受 的 所 有 单词 。 

该 算法 是 在 /usr/dict/words 文 件 中 找到 可 由 Washington 经 过 部 分 换 位 构 词 得 到 的 单词 
的 简单 方法 。 当 然 ， 必 须 找 到 某 种 合理 的 方式 来 模拟 图 10-14 中 的 非 确定 自动 机 ， 我 们 将 在 10.4 
中 讨论 如 何 完成 这 一 任务 。 


10.3.4 习题 


(1) 编写 C 语 言 程序 ， 实 现 图 10-9 中 确定 自动 机 的 算法 。 

(2) 设计 确定 自动 机 ， 使 其 能 正确 地 找 出 字符 串 中 出 现 的 所 有 子 字符 串 man。 并 将 该 自动 机 实现 为 
程序 。 

(3) LASS 和 希望 检测 出 所 有 含 字 符 串 man、son 和 fathez 的 单词 。 设 计 非 确定 自动 机 ， 使 其 只 要 找到 
这 3 个 字符 串 中 任意 一 个 就 接受 相应 的 输入 字符 串 。 

(4)* 设计 确定 自动 机 ， 使 其 可 以 解决 习题 (3) 中 的 问题 。 

(5) 模拟 图 10-9 和 图 10-10 中 的 自动 机 处 理 字符 串 summand 时 的 情况 。 
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(6) 模拟 图 10-14 的 自动 机 处 理 以 下 字符 串 的 情况 。 
(a) saint 
(b) antagonist 
(c) hashish 
其 中 哪些 字符 串 会 被 接受 ? 

(7) 可 以 用 具有 状态 、 输 入 和 接 下 来 这 些 属 性 的 关系 来 表示 自动 机 。 这 样 做 的 目的 是 ， 如 果 (s，x， 沁 
是 个 元 组 ， 那 么 输入 符号 x 就 是 从 状态 s 到 状态 1 的 转换 的 标号 。 如 果 该 自动 机 是 确定 自动 机 ， 和 那么 
该 关系 合适 的 键 是 什么 ”如 果 该 自动 机 是 非 确定 自动 机 呢 ? 

(8) 如 果 只 是 想 在 给 定 某 状态 和 某 输 入 符号 的 情况 下 找 出 接 下 来 的 (一 个 或 一 些 ) 状态 ， 大 家 会 建议 
用 什么 数据 结构 来 表示 习题 (7) 中 的 关系 ? 

(9) 将 如 下 图 所 示 的 自动 机 表示 为 关系 。 

(a) 图 10-10 
(b) 图 10-9 
(c) 图 10-14 
可 以 使 用 椭圆 来 表示 A 一 m 这样 针对 含 大 量 字 母 的 集合 的 转换 。 




















不 编程 找到 部 分 换 位 构 词 形成 的 单词 


顺便 提 一 句 ， 我 们 可 以 使 用 UNIX 系 统 的 命令 ， 几 乎 不 进行 编程 就 实现 示例 10.6 中 的 3 步 算 法 。 对 步 
了 骤 (1)， 可 以 使 用 UNIX 命 令 


tr A-Z a-z </usr/dict/words (10.1) 
把 大 写字 母 转化 成 小 写字 母 。 对 步骤 (2)， 可 以 使 用 命令 





egrep ‘'^[aghinostw]*s" (10.2) 
粗略 地 讲 ， 就 是 定义 了 图 10-12 中 那样 的 自动 机 。 对 步骤 (3)， 可 以 使 用 命令 


egrep -V ‘'a.*alg.*g|h.*h|i.*i|n.*n.*n|o.*o|ls.*s|t.*t|w.*w’ (10.3) 
该 命令 指定 了 类 似 图 10-14 中 自动 机 的 事物 。 整 个 任务 可 以 使 用 以 下 三 元 素 管道 来 完成 : 
(10.1) |1(10.2) | (10.3) 
也 就 是 说 ， 整 个 命令 是 通过 用 表示 各 行 的 文本 替换 各 行 形成 的 。 坚 线 ， 或 者 说 “管道 ”符号 ， 使 得 
左 侧 命令 的 输出 可 以 成 为 右 侧 命令 的 输入 。 我 们 将 在 10.6 节 中 讨论 egrep 命 令 。 
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在 本 节 中 我 们 将 会 看 到 ， 每 一 个 非 确 定 自动 机 都 可 以 被 确定 自动 机 替代 。 正 如 我 们 已 经 看 
到 的 ， 在 执行 某 些 任务 时 ， 考 虑 非 确定 自动 机 有 时 要 更 简单 些 。 不 过 ， 因 为 根据 不 确定 自动 机 
编写 程序 不 如 根据 确定 自动 机 编程 那样 容易 ， 所 以 找到 一 种 将 不 确定 自动 机 变形 为 等 价 的 确定 
自动 机 的 算法 是 很 重要 的 。 
10.4.1 自动 机 的 等 价 性 

在 10.3 节 中 , 我 们 已 经 看 到 两 种 接受 观 。 在 某 些 示例 中 , 比如 在 示例 10.1( 含有 子 序列 aei ou 
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的 单词 ) 中 ， 接 受 就 意味 着 整个 单词 被 接受 ， 即 便 我 们 可 能 没有 扫描 完整 个 单词 。 而 在 另 一 些 
例子 中 ， 比 方 说 示例 10.2 的 反弹 过 滤器 中 ， 或 是 图 10-12 所 示 的 自动 机 (字母 全 在 washington 
中 的 单词 ) 中 ， 只 有 在 我 们 想 对 从 启动 自动 机 以 来 已 经 看 到 的 确切 输入 表示 认可 时 才 接 受 该 输 
入 。 因 此 , 在 示例 10.2 中 ,我 们 接受 所 有 人 能 带 来 输出 1 的 输入 序列 。 在 图 10-12 中 ， 只 有 在 已 经 看 
到 jnewline 字 符 ， 知 道 已 经 看 到 整个 单词 时 才 接 受 该 输入 。 

当 谈 论 正 式 的 自动 机 行为 时 , 我 们 只 需要 第 二 种 解释 ( 当前 的 输入 被 接受 )。 严格 地 讲 , 假 
设 4 和 8 是 两 个 自动 机 ( 确定 或 不 确定 )。 如 果 4 和 B 接 受 相 同 的 输入 字符 串 集 合 ， 就 说 它们 是 等 
价 的 。 换 句 话 说， 如 果 ww …a, 是 任意 符号 串 ， 那 么 以 下 两 个 条 件 是 成 立 的 。 

(1) 如 果 从 4 的 起 始 状态 到 4 的 某 个 接受 状态 存在 以 wa …a: 标记 的 路 径 ， 那 么 从 23 的 起 始 状 
态 到 8 的 某 个 接受 状态 也 存在 以 wma …4w 标记 的 路 径 。 

(2) 如 果 从 B 的 起 始 状 态 到 8B 的 某 个 接受 状态 存在 以 aia,…a 标记 的 路 径 ， 那 么 从 4 的 起 始 状 
态 到 4 的 某 个 接受 状态 也 存在 以 wma …aw 标记 的 路 径 。 


+ 示例 10.7 

考虑 图 10-9 和 图 10-10 中 的 自动 机 。 正 如 我 们 在 图 10-11 中 注意 到 的 ， 图 10-10 中 的 自动 机 接 
受 输入 字符 串 comman， 因 为 该 字符 序列 在 图 10-10 中 标记 了 路 径 0 一 0 一 0 一 0 二 1 二 2 二 3， 
而 且 这 一 路 径 是 从 起 始 状态 出 发 ， 到 达 了 一 个 接受 状态 。 不 过 , 在 图 10-9 所 示 的 确定 自动 机 中 ， 
可 以 验证 由 comman 标 记 的 路 径 只 有 0 一 0 一 0 一 1 一 0 二 0 一 0。 因 此 如 果 图 10-9 是 自动 机 4， 
而 图 10-10 是 自动 机 8B， 就 违背 了 上 述 第 (2) 点 ， 这 样 就 表明 这 两 个 自动 机 不 是 等 价 的 。 


10.4.2 子 集 构造 


我 们 现在 将 会 看 到 ,如 何 通 过 构造 等 价 的 确定 自动 机 来 “消除 自动 机 的 不 确定 性 ”。 这 一 
技巧 叫 作 子 集 构造 , 而 且 它 的 本 质 就 如 图 10-11 和 图 10-15 所 示 , 在 这 两 幅 图 中 我 们 模拟 了 处 理 
特殊 输入 的 非 确 定 自 动机 。 从 这 两 幅 图 中 我 们 注意 到 ， 在 任何 给 定 的 时 间 ， 非 确定 自动 机 都 
在 某 一 状态 集合 中 ， 而 且 这 些 状态 都 出 现在 模拟 图 的 同一 列 中 。 也 就 是 说 ， 在 读 了 某 输 入 列 
40…4 之 后 , 非 确定 自动 机 就 “在 ”那些 从 起 始 状态 出 发 沿 着 标记 有 wa …ax 的 路 径 可 以 到 
达 的 状态 中 。 


+ 示例 10.8 

在 读 完 输入 字符 串 shin 之 后 ， 图 10-15 所 示 的 自动 机 处 在 状态 集合 {0，5，7，9，14} 中 。 
这 些 状态 都 出 现在 第 一 个 n 后 的 一 列 中 。 在读 下 一 个 i 后 ， 它 处 在 状态 集合 {0, 5, 7,，8, 9，14} 
中 ， 而 在 读 了 接 下 来 的 n 后 ， 在 状态 集合 {0，5，7，9，10，14} 中 。 

现在 就 有 了 如 何 把 非 确 定 自动 机 N 转 换 为 确定 自动 机 D 的 线索 。D 的 状态 各 自 是 和 N 的 状态 的 
集合 ,而且 D 中 状态 间 的 转换 是 由 入 的 转换 确定 的 。 要 看 到 如 何 构建 D 的 转换 ， 设 S 是 D 的 某 个 状 
态 , 而 且 x 是 某 输 入 符号 。 因 为 5 是 D 的 状态 ,所 以 它 是 由 入 的 状态 组 成 的 。 定义 集合 7 是 自动 机 N 
中 那些 状态 :， 这 些 状态 满足 存在 S 中 的 状态 x， 以 及 自动 机 N 针 对 包含 输入 符号 x 的 集合 的 从 s 到 1 
的 转换 。 那 么 在 自动 机 D 中 我 们 就 放置 一 个 在 针对 符号 x 的 从 5S 到 7 的 转换 。 

示例 10.8 展 示 了 多 个 针对 输入 符号 的 从 一 个 确定 状态 到 另 一 个 确定 状态 的 转换 。 在 当前 的 
确定 状态 是 {0，5，7，9，14}， 而 且 输 入 符号 是 字母 时 ， 我 们 在 该 示例 中 看 到 ， 根 据 图 10-14 
中 的 非 确定 自动 机 ， 接 下 来 的 不 确定 状态 集 是 7 = {0，5，7，8，9，14}。 由 针对 输入 符号 n 的 
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这 一 确定 状态 可 知 ， 接 下 来 的 不 确定 状态 集 是 = {0，5，7，9，10，14}。 这 两 个 确定 转换 如 
图 10-16 所 描述 的 那样 。 


7 U 





图 10-16 ”确定 状态 A、7T 和 UU 之 间 的 转换 


现在 我 们 知道 该 如 何在 确定 自动 机 D 的 两 个 状态 之 间 构 建 转换 了 ， 不 过 需要 确定 自动 机 D 
确切 的 状态 集 、D 的 起 始 状 态 ， 以 及 D 的 接受 状态 。 我 们 要 用 归纳 法 来 构建 D 的 状态 。 

依据 。 如 果 非 确定 自动 机 和 的 起 始 状 态 是 so， 那 么 确定 自动 机 D 的 起 始 状 态 是 {so} ， 也 就 是 
只 含 so 这 一 个 元 素 的 集合 。 

归纳 。 假设 已 经 确定 了 AN 的 状态 集 5 是 D 的 一 个 状态 。 依 次 考虑 每 个 可 能 的 输入 学 符 x。 对 某 
个 给 定 的 x， 设 7 是 w 的 状态 上 构成 的 集合 ， 其 中 状态 三 足 对 $ 中 的 某 个 状态 而 言 ， 存 在 标号 含 x 
的 从 s 到 的 转换 。 那 么 集合 7 就 是 D 的 一 个 状态 ， 而 且 存 在 针对 输入 x 的 从 S 到 7 的 转换 。 

D 的 接受 状态 是 N 的 状态 集中 至 少 包含 N 的 一 个 接受 状态 的 。 这 从 直觉 上 讲 是 说 得 通 的 。 
如 果 S 是 D 的 状态 而 且 是 N 的 状态 集 ， 那 么 能 把 D 从 其 起 妈 状 态 带 到 状态 5 的 输入 aia,…ai 也 能 
把 NM 从 其 起 始 状态 带 到 $ 中 的 所 有 状态 。 如 果 $ 含 有 某 个 接受 状态 ， 那 么 aia,…a 会 被 N 接 受 ， 
而 且 D 也 一 定 会 接受 该 输入 。 因 为 D 在 接收 输入 ww …@ 时 只 会 进入 状态 53， 所 以 5S 肯定 是 D 的 
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3 
图 10-17 ”识别 以 man 结 尾 字 符 串 的 非 确定 自动 机 


+ 示例 10.9 

图 10-17 重 现 了 图 10-10 所 示 的 非 确 定 自 动机 ， 我 们 来 把 它 转 换 成 确定 自动 机 D。 先 从 DD 的 起 
始 状态 {0} 开 始 。 

这 一 构建 过 程 的 归纳 部 分 要 求 我 们 查看 DD 的 每 个 状态 ， 并 确定 它 的 转换 。 对 {0} 而 言 ， 只 需 
要 询问 状态 0 通 向 哪里 。 分 析 图 10-17 得 到 的 答案 是 ， 对 除了 rm 之 外 的 任意 字母 ， 状 态 0 只 能 进入 
状态 0， 而 对 输入 mn， 它 同时 通 向 状态 0 和 状态 1。 因 此 自动 机 D 需 要 已 经 具备 的 状态 {0} 和 我 们 必 
须 添 加 的 状态 {0，1}。 目 前 为 止 已 经 为 BD 构建 的 转换 和 状态 如 图 10-18 所 示 。 
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0) 
图 10-18 ”状态 {0} 及 其 转换 


接 下 来 ， 必 须 考 虑 从 状态 10，1} 出 发 的 转换 。 再 次 研究 图 10-17， 我 们 看 到 ， 对 除了 m 和 a 
之 外 的 所 有 输入 ， 状 态 0 只 通 向 状态 0， 而 状态 1 则 不 能 通 向 任何 地 方 。 因 此 , 存在 从 状态 10，1} 
到 状态 {0} 的 转换 ， 标 记 为 除了 m 和 a 之 外 的 所 有 字母 。 对 输入 m， 状态 1 还 是 不 能 通 向 任何 地 方 ， 
不 过 状态 0 会 同时 通 向 状态 0 和 状态 1。 因 此 ， 存 在 从 状态 10，1} 到 其 本 身 的 转换 ， 标 记 为 m。 最 
后 ， 对 输入 a， 状 态 0 只 会 通 向 它 自己 ， 不 过 状态 1 是 通 向 状态 2 的 。 因 此 存在 标记 为 a 的 从 状态 
{0，1} 到 状态 10，2} 的 转换 。 目 前 为 止 D 已 经 构建 起 的 部 分 如 图 10-19 所 示 。 











图 10-19 ”状态 {0} 和 {0，1}， 以 及 它们 的 转换 


现在 需要 构建 从 状态 {0, 2} 出 发 的 转换 。 对 除 m 和 n 之 外 的 所 有 输入 , 状态 0 只 能 通 向 状态 0， 
而 状态 2 则 哪里 都 去 不 了 ， 因 此 存在 从 {0，2} 到 {0} 的 转换 ， 标 记 为 除了 m 和 n 之 外 的 所 有 字母 。 
对 输入 m, 状态 2 不 通 向 任何 状态 , 而 状态 0 则 同时 通 向 状态 0 和 状态 1, 因此 标记 为 m 的 从 状态 {0， 
2} 到 状态 10，1 的 转换 。 对 输入 nm， 状态 0 只 通 向 它 本 身 ， 而 状态 2 会 通 向 状态 3。 因 此 存在 标记 
为 n 的 从 状态 {0， 2} 到 状态 {0，3} 的 转换 。D 的 该 状态 是 接受 状态 ,因为 它 包 含 了 图 10-17 中 的 接 

最 后 ， 必 须 给 出 从 状态 {0，3} 出 发 的 转换 。 因 为 对 任何 输入 ,状态 3 都 不 通 疝 任何 状态 ,从 
状态 {0，3} 出 发 的 转换 只 反映 从 状态 0 出 发 的 转换 ， 因 此 会 与 {0} 通 向 相同 的 状态 。 因 为 从 状态 
{0，3} 出 发 的 转换 不 会 将 我 们 带 到 尚未 见 过 的 D 的 状态 ， 所 以 对 D 的 构造 就 完成 了 。 完 整 的 确定 
自动 机 如 图 10-20 所 示 。 

















图 10-20 ”确定 自动 机 D 
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请 注意 ， 这 一 确定 自动 机 可 以 正确 地 接受 所 有 以 man 结 尾 的 字母 串 ， 而 且 只 接受 以 man 结 
尾 的 字母 串 。 直 觉 上 讲 ， 只 要 字符 串 目前 为 止 不 是 以 m、ma、man 结 尾 , 该 自动 机 就 会 处 在 状态 
{0} 中 。 状 态 {0，1} 意 味 着 目前 为 止 看 到 的 字符 串 是 以 m 结 尾 的 ， 状 态 {0，2} 表 示 当 前 的 字符 串 
是 以 ma 结尾 ， 而 状态 {0，3} 则 说 明 当 前 字符 串 的 结尾 为 man。 


+ 示例 10.10 

图 10-17 中 的 非 确 定 自动 机 有 4 个 状态 ， 而 图 10-20 中 与 它 等 价 的 确定 自动 机 也 有 4 个 状态 。 
如 果 所 有 的 非 确定 自动 机 都 能 转换 成 小 型 确定 自动 机 就 好 了 ， 例 如， 在 编译 编程 语言 中 常用 到 
的 某 些 自动 机 其 实 可 以 转换 成 相当 小 的 确定 自动 机 。 不 过 ， 不 能 保证 确定 自动 机 一 定 很 小 ， 具 
有 K 个 状态 的 非 确定 自动 机 有 可 能 最 终 被 转换 成 状态 多 达 2“ 个 的 确定 自动 机 。 也 就 是 说 ， 对 非 确 
定 自动 机 状态 集 的 究 集 中 的 每 个 成 员 ， 确 定 自动 机 都 有 相应 的 状态 。 

举 个 会 得 到 很 多 状态 的 例子 ， 考 虑 一 下 10.3 节 图 10-14 中 的 自动 机 。 因 为 该 非 确定 自动 机 有 
20 种 状态 ， 可 以 想象 一 下 ， 通 过 子 集 构造 构建 的 确定 自动 机 可 能 有 约 2” 个 ,或 者 说 是 超过 100 
万 个 状态 ,这些 状 态 全 都 是 {0, 1,…, 19} 的 窜 集 的 成 员 。 实 际 结果 并 没有 这 么 糟 ,但 也 存在 相当 
多 的 状态 。 

我 们 不 会 尝试 画 出 与 图 10-14 中 非 确定 自动 机 等 价 的 确定 自动 机 。 不过, 可 以 考虑 一 下 实际 上 
需要 哪些 状态 集 。 首 先 ， 因 为 对 每 个 字母 都 有 从 状态 0 到 其 自身 的 转换 ， 所 以 实际 看 到 的 所 有 状 
态 集 都 包含 0。 如 果 字 母 a 尚未 输入 ， 就 不 能 到 达 状 态 1。 不过， 如 果 刚 好 已 经 看 到 一 个 a， 不管 还 
看 到 些 什 么 ， 我们 都 将 在 状态 1 中 。 我 们 还 可 以 为 vashington 中 其 他 任何 字母 得 出 相似 的 论断 。 

如 果 在 状态 0 中 开始 图 10-14， 并 为 其 提供 属于 washington 中 所 出 现 字 母 的 子 集 的 一 列 字 
母 ， 然 后 除了 在 状态 0 中 之 外 ， 还 可 以 在 状态 1、3、5、7、9、12、14、16 和 18 的 某 个 子 集中 。 
通过 恰当 地 选择 输入 字母 ， 我 们 可 以 安排 在 这 些 状态 集 的 任意 一 个 中 。 因 为 有 2 =512 个 这 样 
的 集合 ， 所 以 在 与 图 10-14 等 价 的 确定 自动 机 中 至 少 有 这 么 多 个 状态 。 

不 过 ,其 中 的 状态 要 更 多 ,因为 字母 n 在 图 10-14 中 得 到 了 特殊 处 理 。 如 果 在 状态 9 中 , 我 们 
还 可 以 在 状态 10 中 ， 而 且 如 果 已 经 看 到 两 个 ， 其 实 就 将 同 处 状态 9 和 状态 10 中 。 因 此 ， 尽 管 对 
其 他 8 个 字母 来 说 都 只 有 两 个 选择 ( 比如 ， 对 字母 a， 要 包含 状态 1， 要 么 不 含 状态 1 )， 而 对 字母 
n 来 说 , 共有 3 种 选择 ( 既 不 含 状态 9 也 不 含 状态 10、 只 包含 状态 9, 或 者 同时 包含 状态 9 和 状态 10 )。 
因为 至 少 存 在 3x2 = 768 种 状态 。 

不 过 这 并 非 全 部 。 如 果 到 目前 为 止 的 输入 以 washington 中 的 字母 之 一 结束 ， 而 且 我 们 之 前 
已经 看 到 足够 多 的 该 字母 ， 那么 我 们 也 应 该 在 对 应 该 字母 的 接受 状态 中 ， 比 方 说 ， 对 a 来 说 就 是 状 
态 2。 然而 , 我 们 在 处 理 相 同 输入 后 不 可 能 在 两 个 接受 状态 中 。 为 增加 的 状态 集 计数 变 得 更 麻烦 了 。 

假设 接受 状态 2 是 该 集合 的 成 员 。 那么 可 知 1 也 是 该 集合 的 成 员 , 0 当然 也 是 , 不 过 我 们 仍然 
对 与 除 a 之 外 的 字母 对 应 的 状态 拥有 所 有 选择 ， 这 类 集合 的 数量 是 3x2"” ,或 者 说 是 384。 如 果 我 
们 的 集合 包含 接受 状态 4、6、8、13、15、17 或 19， 这 样 的 道理 也 同样 实用 ， 在 每 种 情况 中 都 有 
384 个 集合 包含 相应 的 接受 状态 。 唯 一 的 例外 就 是 含 接受 状态 11 ( 就 是 状态 9 和 状态 10 也 出 现 ) 
的 情况 。 在 该 情况 下 ， 只 有 2 二 256 种 选择 。 因 此 ， 该 等 价 确定 自动 机 的 状态 总 数 为 : 

768+8x384 上 +256 一 4864 

第 一 项 768 表 示 那 些 不 含 接受 状态 的 集合 的 数量 。 接 下 来 的 一 项 ， 表 示 的 是 分 别 包含 与 除 n 

之 外 其 他 8 个 字母 对 应 的 接受 状态 的 8 类 集合 的 数量 ， 第 三 项 256 则 表示 含 状态 11 的 集合 的 数量 。 
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关于 子 集 构造 的 想法 


子 集 构造 是 相当 不 好 理解 的 ,特别 是 确定 自动 机 的 状态 可 以 是 非 确定 自动 机 的 状态 集 这 一 
思路 可 能 需要 大 家 耐心 思考 才能 想 通 。 不 过 ,这 种 把 结构 化 对 象 ( 状态 集 ) 与 原子 对 象 ( 确定 
自动 机 的 各 个 状态 ) 融合 成 同一 对 象 的 概念 ， 是 计算 机 科学 中 的 一 种 重要 概念 。 我 们 已 经 在 程 
序 中 看 到 过 这 一 概念 ， 而 且 经 常 必须 用 到 它 。 例 如 ， 通 数 的 和 参数， 比方 说 LL， 表 面 上 看 是 原子 
的 ， 而 对 其 进行 更 仔细 的 检查 可 能 发 现 它 是 有 着 复杂 结构 的 对 象 ， 比 如 ， 有 具有 连接 到 其 他 记录 
的 字段 从 而 能 形成 表 的 记录 。 同 样 ， 图 10-20 中 确定 自动 机 D 的 状态 {0，2} 也 可 以 用 简单 的 名 称 
“5” 或 “qa” 来 代替 。 





10.4.3 ” 子 集 构造 起 效 的 原因 


很 明显 , 如 果 D 是 利用 子 集 构造 从 非 确 定 自动 机 NN 构建 的 , 那么 D 就 是 确定 自动 机 。 原因 在 于 ， 
对 每 个 输入 符号 x 和 和 D 的 每 个 状态 S 而 言 ， 我 们 定义 了 D 的 某 特定 状态 7， 它 满足 从 5 到 7 的 转换 的 标 
号 中 包含 x。 不 过 如 何 得 知 自动 机 N 和 D 是 等 价 的 呢 ?” 也 就 是 说 ， 我 们 需要 知道 ， 对 任意 输入 序列 
aia,…a, ， 当 且 仪 当 和 N 接 受 aa,…a, 时 ， 在 下 列 情况 下 ， 自 动机 D 到 达 的 状态 5S 是 种 接受 状态 。 

(1) 从 起 始 状 态 开始 ; 

(2) 并 且 沿 着 标记 为 wa …a, 的 路 径 行进 。 

请 记 住 ， 当 且 仅 当 从 X 的 起 始 状 态 有 一 条 标记 为 a.a,…a 的 路 径 能 到 达 N 的 某 个 接受 状态 
时 ，A 和 N 才 会 接受 qia,:…a, 。 

D 所 做 的 事情 与 N 所 做 的 事情 之 间 的 联系 就 更 紧密 了 。 如 果 D 具 有 从 它 的 起 始 状 态 到 标记 为 
aia,…ai 的 状态 的 路 径 ， 那 么 被 视 为 自动 机 和 N 的 某 个 状态 集 的 集合 $， 就 刚好 是 从 N 的 起 始 状态 开 
台 沿 着 某 标记 为 a.a,…a, 的 路 径 所 能 到 达 的 状态 组 成 的 集合 。 这 种 关系 如 图 10-21 所 示 。 因 为 我 们 
已 经 定义 了 ， 只 有 在 S 中 的 某 一 成 员 是 和 N 的 接受 状态 时 ，S 才 是 D 的 接受 状态 ， 所 以 要 得 出 D 和 NN 都 
接受 qia,…a 或 都 不 接受 aia,…a, ， 也 就 是 要 得 出 D 和 N 是 等 价 的 ， 就 只 需要 图 10-21 所 示 的 关系 。 








起 始 Q10Q2 ...QK ~ ) 


(b) 在 自动 机 N 中 
图 10-21 非 确 定 目 动机 N 的 操作 与 对 应 的 确定 自动 机 D 的 操作 间 存 在 的 关系 
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我 们 需要 证 明 图 10-21 所 示 的 关系 ， 该 证 明 要 对 输入 字符 串 长 度 4 进 行 归纳 。 需 要 通过 对 / 
的 归纳 来 证 明 的 正式 命题 是 ， 从 D 的 起 始 状态 开始 沿 着 标记 为 aa,…a, 的 路 径 到 达 的 状态 
fs s2…， 5,} ， 刚 好 是 从 N 的 起 始 状态 开始 沿 着 标记 为 gq,…a, 的 路 径 到 达 的 状态 构成 的 

2 

依据 。 设 大 =0。 长 度 为 0 的 路 径 将 我 们 留 在 出 发 的 位 置 ， 也 就 是 ,在 自动 机 D 和 N 的 起 始 状 
态 中 。 回 想 一 下 ， 如 果品 是 N 的 起 始 状态 ， 忆 的 起 始 状态 就 是 {s }。 因 此 该 归纳 命题 对 上 = 0 来 
说 成 立 。 

归纳 。 假 设 该 命题 对 k 成 立 ， 并 考虑 输入 字符 串 ma …wiaui 。 那么 标记 为 ma,…auau 的 从 
D 的 起 始 状态 到 状态 7 的 路 径 就 如 图 10-22 所 示 , 也 就 是 说 , 在 它 针对 输入 a,, 进行 到 7 的 转换 ( 最 
后 一 次 转换 ) 之 前 ， 会 经 过 某 个 状态 5。 





图 10-22 5 是 D 在 到 达 状 态 7 之 前 到 达 的 状态 


通过 归纳 假设 ， 可 以 假设 S$ 正好 是 自动 机 N 从 其 起 始 状 态 沿 着 标记 为 aa,…a 的 路 径 所 能 到 
达 的 状态 组 成 的 集合 ,并 必须 证 明 7 刚好 是 从 NN 的 起 始 状 态 出 发 沿 着 标记 为 aia,…aiai, 的 路 径 所 
能 到 达 的 状态 组 成 的 集合 。 该 归纳 步骤 的 证 明 包 含 下 列 两 个 部 分 。 

(必须 证 明 ，7 不 含 过 多 的 状态 ， 也 就 是 说 ， 如 果 古 在 7 中 的 X 的 状态 ,那么 十 从 的 起 始 
状态 沿 着 标记 为 a.a,…aa,， 的 路 径 可 以 到 达 的 。 

(2) 必 须 证 明 , 7 包含 足够 的 状态 , 也 就 是 说 , 如 果 t 是 从 N 的 起 始 状 态 沿 着 标记 为 wma, aa ， 
的 路 径 可 以 到 达 的 状态 ， 那 么 束 在 7 中 。 

对 (1) 来 说 , 设 在 7 中 。 那么 ,如 图 10-23 所 示 , 在 $ 中 一 定 存在 一 个 状态 *， 可 以 证 实在 7 中 。 
也 就 是 说 ， 在 N 中 存在 从 s 到 1 的 转换 ， 而 且 它 的 标号 包含 a,,。 根 据 归纳 假设 ， 因 为 s 在 S 中 ， 所 
以 上 表 定 存在 从 N 的 起 始 状 态 到 s 的 标记 为 aa,…a, 的 路 径 。 因 此 ， 存 在 从 N 的 起 始 状 态 到 1， 标 记 
为 qaqa,…aia,, 的 路 径 。 


-人 


图 10-23 5 中 的 状态 s 解 释 了 为 何 将 状态 t 改 进 7 中 


现在 必须 证 实 (2), 也 就 是 如 果 存 在 从 NN 的 起 始 状 态 到 1 的 , 标记 为 a.a,…aiai 的 路 径 ， 那么 
! 就 在 7 中 。 束 在 这 条 路 径 针对 输入 ws 进行 到 上 的 转换 之 前 ， 肯 定 会 经 过 某 个 状态 s。 因 此 ， 存 在 
从 N 的 起 始 状态 开始 到 *,， 标记 为 ma …ax 的 路 径 。 根据 归纳 假设 ,s 在 状态 集 S 中 。 因 为 N 具 有 从 
5s 到 1 而 且 标 号 含有 ai, 的 转换 ,所 以 应 用 到 状态 集 S 和 输入 符号 a,, 上 的 子 集 构造 需要 1 被 放置 到 7 
中 。 因 此 奔 7 中 。 

在 给 定 归纳 假设 的 情况 下 ,现在 就 证 明了 ，7 刚 好 是 由 入 中 从 NN 的 起 始 状 态 开 始 沿 着 标记 为 
qq,…aiann 的 路 径 可 达 的 状态 组 成 的 。 这 就 是 归纳 步骤 ， 因 此 可 以 得 出 ， 沿 着 标记 为 aia,…a 
的 路 径 到 达 的 确定 状态 机 D 的 状态 ,永远 都 是 N 沿 着 标号 相同 的 路 径 可 达 的 状态 组 成 的 集合 。 
为 D 的 接受 状态 是 那些 包含 N 的 某 个 接受 状态 的 状态 集 ， 所 以 可 以 得 到 D 和 NN 接 受 相同 字符 串 的 
结论 ， 也 就 是 说 D 和 NN 是 等 价 的 ， 所 以 子 集 构造 是 “ 行 得 通 的 ”。 
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10.4.4 习题 


(1) 利用 子 集 构造 ， 把 10.3 节 习题 (3) 中 的 非 确 定 自 动机 转换 成 确定 自动 机 。 
(2) 图 10-24a 到 图 10-24d 中 的 非 确定 自动 机 可 以 识别 什么 模式 ? 
(3) 把 图 10-24a 到 图 10-24d 中 的 非 确 定 自动 机 转换 成 确定 有 限 自 动机 。 





自动 机 的 最 小 化 


与 自动 机 相关 ， 特 别 是 在 利用 自动 机 设计 电路 时 会 遇 到 的 一 个 问题 就 是 ， 热 行 某 给 定 任务 需要 多 少 
状态 。 也 就 是 说 ， 我 们 可 能 要 问 ， 给 定 某 自 动机 ， 是否 存在 状态 更 少 的 等 价 自 动机 ?如 果 这 样 的 话 ， 那 么 
这 样 的 等 价 自动 机 中 最 小 的 状态 数量 是 多 少 ? 

事实 证 明 ， 如 果 将 问题 限制 在 确定 自动 机 的 范畴 ， 那 么 与 任意 给 定 自动 机 等 价 的 最 小 状态 确定 自动 
机 是 唯一 的 ,而 且 很 容易 找到 它 。 关键 就 在 于 定义 确定 状态 机 两 个 状态 s 和 1 什么 时 候 是 等 价 的 , 也 就 是 说 ， 
对 任意 的 输入 序列 ,分别 从 s 和 1 出 发 而 且 由 该 序列 标记 的 路 径 , 要 么 都 能 到 达 接 受 状 态 , 要 么 都 不 能 到 达 。 
如 果 状 态 s 和 1t 是 等 价 的 , 就 没 法 通过 为 自动 机 提供 输入 来 区 分 这 两 者 ,因此 就 可 以 把 gs 和 1 合并 为 一 个 状态 。 
事实 上 ， 按 照 如 下 方式 定义 不 等 价 的 状态 要 更 容易 。 

依据 。 如 果 s 是 接受 状态 而 t 是 不 接受 ， 那 么 s 和 1 是 不 等 价 的 ， 反 之 亦 然 。 

归纳 。 如 果 存 在 某 输入 符号 x， 使 得 针对 输入 x 存在 从 状态 s 和 1 分 别 到 两 个 已 知 状 态 的 转换 不 等 价 ， 
那么 s 和 1 就 是 不 等 价 的 。 

要 让 这 个 测试 起 效 , 还 需要 补充 一 些 细节 。 特别 要 提 的 是 , 我们 可 能 必须 添加 一 个 “停滞 状态 ”， 
它 不 接受 任何 输入 ， 而 且 针 对 所 有 输入 都 存在 到 它 自 身 的 转换 。 由 于 确定 自动 机 可 能 针对 某 个 给 定 符 
号 不 存在 从 某 给 定 状 态 出 发 的 转换 ， 因 此 在 执行 这 一 最 小 化 程序 之 前 ， 需 要 针对 所 有 不 存在 其 他 转换 
的 输入 ， 添 加 从 任意 状态 到 该 停滞 状态 的 转换 。 可 以 注意 到 ， 不 存在 类 似 的 用 于 最 小 化 非 确定 自动 机 
的 理论 。 








(4)* 某 些 自动 机 具有 一 些 根本 不 存在 转换 的 “状态 -输入 ”组 合 。 如 果 状 态 s 不 存在 针对 符号 x 的 转换 ， 
我 们 就 可 以 添加 一 种 针对 符号 zx 的、 从 s 到 某 个 特殊 的 “ 停 清 状 态 ” 的 转换 。 停 沾 状 态 是 不 接受 状 
态 ， 而 且 针 对 任意 输入 符号 都 有 到 其 自 且 的 转换 。 证 明 ， 添 加 了 “停滞 状态 ”的 自动 机 与 原 有 的 
自动 机 是 等 价 的 。 

(5) 证 明 ， 如 果 为 确定 自动 机 添加 了 停滞 状态 ， 就 可 以 得 到 具有 从 起 始 状 态 出 发 而 且 标 记 为 每 个 可 能 
字符 串 的 路 径 的 等 价 自 动机 。 

(6)* 证明， 如 果 对 确定 自动 机 进行 子 集 构造 ， 那 么 要 么 得 到 相同 的 自动 机 ， 其 中 每 个 状态 s 都 重 命名 
为 {s}， 要 人 么 添加 了 停滞 状态 ( 对 应 空 状 态 集 ) 。 

(7)** 假设 有 茶 确 定 自 动机 ， 并 要 把 每 个 接受 状态 变 成 不 接受 状态 ， 还 要 把 每 个 不 接受 状态 变 成 接受 
状态 。 

(a) 如 何 用 旧 目 动机 的 语言 来 摘 述 新 自动 机 接受 的 语言 ? 
(b) 如 果 先 为 原 自 动机 加 上 停 沛 状态 ， 重 复 (a) 小 题 。 
(c) 如 果 原 自动 机 是 非 确定 自动 机 ， 重 复 (a) 小 题 。 
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图 10-24” 非 确定 自动 机 


10.5 正则 表达 式 


自动 机 定义 了 模式 ， 即 表示 上 自动 机 的 图 中 ， 作 为 从 起 始 状态 到 某 个 接受 状态 的 路 径 标号 的 
字符 串 组 成 的 集合 。 在 本 节 中 ， 我 们 遇 到 了 正则 表达 式 这 种 用 来 定义 模式 的 代数 方法 。 正 则 表 
达 式 与 我 们 熟悉 的 算术 表达 式 代 数 ， 以 及 第 8 章 中 遇 到 的 关系 代数 都 是 相似 的 。 有 趣 的 是 ,可 以 
用 正则 表达 式 代 数 表 示 的 模式 组 成 的 集合 ， 刚 好 与 可 以 用 自动 机 描述 的 模式 组 成 的 集合 相同 。 





表示 方式 的 约定 


我 们 还 将 继续 使 用 等 宽 字 体 来 表示 出 现在 字符 串 中 的 字符 。 与 某 给 定 字 符 对 应 的 正则 表达 
式 原子 操作 数 则 会 用 加 粗 的 该 字符 来 表示 。 例如 ,a 是 对 应 字符 a 的 正则 表达 式 。 在 我 们 需要 使 

Rs 变量 在 这 里 用 来 代表 复杂 的 表达 式 。 例 如 , 使 用 变量 /etter 表 示 “ 任 
意 字母 ”这 个 我 们 很 快 就 要 看 到 其 正则 表达 式 的 集合 。 
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10.5.1 正则 表达 式 的 操作 数 


与 所 有 的 代数 一 样 ， 正 则 表达 式 也 具有 某 几 类 原子 操作 数 。 在 算术 代数 中 ， 原 子 操作 数 是 
常数 ( 比如 整数 或 实数 ), 或 可 能 的 值 是 常数 的 变量 ; 而 对 关系 代数 而 言 ， 原 子 操作 数 要 么 是 固 
定 的 关系 ， 要 么 是 可 能 的 值 为 关系 的 变量 。 在 正则 表达 式 代 数 中 ， 原 子 操作 数 是 如 下 几 种 中 的 
一 种 。 

(1) 字符 ; 

(2) e 符号 ; 

(3) 名 符号 ; 

(4) 值 可 能 为 由 正则 表达 式 定义 的 任意 模式 的 变量 。 


10.5.2 ”正则 表达 式 的 值 


任意 代数 中 的 表达 式 都 具有 某 一 类 型 的 值 。 对 算术 表达 式 来 说 ， 值 可 以 是 整数 、 实 数 ， 或 
是 我 们 可 以 处 理 的 任意 类 型 的 数字 。 对 关系 代数 而 言 ， 表 达 式 的 值 就 是 个 关系 。 

对 正则 表达 式 来 说 ， 每 个 表达 式 的 值 都 是 由 通常 被 称 为 语言 的 字符 串 集 合 组 成 的 模式 。 由 
正则 表达 式 E 表 示 的 语言 就 被 称 为 L(Z)， 或 者 是 “E 的 语言 "。 原 子 操作 数 的 语言 有 如 下 定义 。 

(1) 如 果 x 是 任意 字符 ， 那 么 正则 表达 式 x 表 示 语 言 {x}; 也 就 是 说 ，L(x)={x}。 请 注意 ,该 
语言 是 包含 一 个 字符 串 的 集合 ， 该 字符 串 的 长 度 为 1， 而 且 字 符 串 中 唯一 的 位 置 被 字符 x 占据 。 

(2) Ze={e}。 作 为 正则 表达 式 的 特殊 字符 e 表 示 只 含 一 个 空 字符 串 (或 者 说 长 度 为 0 的 字符 
串 ) 的 字符 串 集合 。 

(3) L(g ={ 儿 }。 作 为 正则 表达 式 的 特殊 字符 名 表示 字符 串 集合 为 空 。 

请 注意 ， 我 们 没有 定义 原子 操作 数 为 变量 时 的 值 。 只 有 在 将 变量 替换 为 具体 的 表达 式 时 ， 
才 可 以 为 这 样 的 操作 数 取 值 ， 而 且 它 的 值 就 是 相应 的 表达 式 的 值 。 


10.5.3 ”正则 表达 式 的 运算 


正则 表达 式 中 运算 符 共 有 3 种 。 这 些 运 算 符 都 可 以 用 括号 分 组 ,就 像 我 们 所 熟悉 的 代数 中 那 
样 。 和 代数 表达 式 中 所 做 的 一 样 ， 存 在 一 些 让 我 们 可 以 忽略 某 些 括号 对 的 优先 次 序 和 结合 律 。 
在 探讨 完 这 些 运 算 后 ， 我 们 将 会 描述 关于 括号 的 规则 。 

1. 并 

第 一 种 ， 也 是 我 们 最 熟悉 的 一 种 运算 符 就 是 并 运算 符 ， 我 们 要 将 其 表示 为 |。 为 正则 表达 
式 取 并 的 规则 是 ， 如 果 R 和 5 为 两 个 正则 表达 式 ， 那 么 RIS 表 示 R 和 5S 所 表示 的 语言 取 并 。 也 就 是 
说 ，Z(RIS) =L(R)JL(S) 。 回 想 一 下 ,ZL(R) 和 ZL(R) 都 是 字符 串 的 集合 ， 所 以 为 它们 取 并 的 概 


念 是 说 得 通 的 。 


+ 示例 10.11 

我 们 知道 a 是 表示 {fa} 的 正则 表达 式 ， 而 b 是 表示 {b} 的 正则 表达 式 。 因 此 a1b 就 是 表示 {a， 
pb} 的 正则 表达 式 。 这 是 一 个 包含 a 和 b 这 两 个 长 度 为 1 的 字符 串 的 集合 ， 

同样 ， 可 以 写 出 诸如 (al1b)lc 这 样 的 表达 式 ， 来 表示 和 集合 {a，b，c}。 因 为 取 并 是 一 种 有 结 
































J 在 正则 表达 式 中 ， 加 号 + 也 常用 作 并 运算 符 ， 不 过 在 这 里 并 不 这 样 表示 。 
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合 性 的 运算 符 ， 也 就 是 说 ， 在 为 3 个 集合 求 并 集 时 ， 以 任意 次 序 组 合 这 些 操 作 数 都 是 没关系 的 ， 
可 以 忽略 括号 ， 并 直接 将 表达 式 写 为 alblec。 

2. 串 接 

正则 表达 式 代 数 的 第 二 个 运算 符 叫 作 串 接 ( concatenation )。 它 是 用 没有 任何 运算 符 符号 来 
表示 的 ， 就 像 在 写 乘法 表达 式 时 有 时 会 省 略 运算 符 那 样 ,例如 , 算术 表达 式 ab 就 表示 a 和 2b 的 积 。 
和 取 并 运算 一 样 ， 串 接 运 算 也 是 二 元 的 中 缀 运算 符 。 如 果 R 和 5 是 正则 表达 式 ， 那么 RS 就 是 R 和 S 
的 串 接 。” 

RS 表示 的 语言 L(RS) 是 由 语言 LCR) 和 L(5S) 按 照 以 下 方式 形成 的 。 对 L(R) 中 的 各 字符 串 r 以 及 L(5) 
中 的 各 字符 串 s 来 说 , 字符 串 r 和 s 的 串 接 rs 是 在 L(RS) 中 的 。 回想 一 下 两 个 表 ( 比如 字符 串 ) 的 串 接 ， 
是 通过 按 次 序 取 第 一 个 表 中 的 元 素 ， 并 在 它们 之 后 按 次 序 接 上 第 二 个 表 的 元 素 而 形成 的 。 





























类 型 之 间 的 一 些微 妙 区 别 
读者 不 应 该 弄 混 看 似 相 似 , 实则 差别 巨大 的 多 种 对 象 。 例 如 ,， 空 字符 串 e 就 和 空 集 何不 同 ， 


CR 合 {e } 不 同 。 空 字符 囊 的 类 型 是 “字符 串 ” 或 “字符 表 ”， 
而 空 集 和 只 含 空 字符 串 的 集合 都 是 “字符 串 集 合 ” 类 型 的 。 


我 们 还 应 该 记得 时 类 型 为 “字符 ” 的 字符 a， 类 型 为 “字符 串 ” 的 长 度 为 1 的 字符 串 a， 以 及 
类 型 为 “字符 串 集 合 ” 的 正则 表达 式 a 的 值 {a} 之 间 的 区 别 。 还 要 注意 到 在 其 他 的 上 下 文中 ，f{a} 
可 能 表示 包含 字符 a 的 集合 ,而 且 我 们 没有 表示 方式 上 的 约定 用 ee 两 种 含义 ,不 过 ， 
在 本 章 的 内 容 中 ，{fa} 通 常 都 具有 前 一 种 解释 ， 也 就 是 “字符 串 集 合 ”而 非 “ 字 符 集合 ”。 





+ 示例 10.12 

设 R 是 正则 表达 式 a， 因 此 L(R) 就 是 集合 {a}。 再 设 S 是 正则 表达 式 b， 所 以 L(S) = {p}。 那么 
RS 就 是 表达 式 ab。 要 形成 L(RS), 需要 取 L(R) 中 的 每 个 字符 串 , 将 其 与 7(5) 中 的 每 个 字符 串 串 接 。 
在 这 种 简单 的 情况 中 , L(R) 和 LL(S) 都 是 单元 素 集 ， 所 以 对 其 二 者 来 说 都 各 上 自 只 有 一 种 选择 。 我 们 
从 L(R) 中 选择 a， 并 从 L(5) 中 选择 bp， 然 后 将 这 两 个 长 度 为 1 的 表 串 接 起 来 ， 就 得 到 了 字符 串 ab。 
因此 L(RS) 就 是 {ab}。 

可 以 对 示例 10.12 进 行 概 括 ， 得 出 任意 用 粗 体 表示 的 字符 串 ， 都 是 表示 由 一 个 字符 串 ( 相应 
字符 组 成 的 表 ) 构成 的 语言 的 正则 表达 式 。 比 如 ，then 就 是 语言 为 {then} 的 正则 表达 式 。 我 
们 将 看 到 ， 串 接 是 一 种 具有 结合 性 的 运算 符 ， 所 以 不 管 正则 表达 式 中 的 字符 如 何 分 组 都 是 没 关 
系 的 ， 而 且 不 需要 使 用 括号 。 


+ 示例 10.13 
现在 来 看 看 两 个 语言 不 是 单元 素 集 的 正则 表达 式 的 串 接 。 设 R 是 正则 表达 式 al(ab)。? 
L(R) 就 是 L(a) 和 L(ab) 的 并 集 ， 即 {a，ab}。 设 S 是 正则 表达 式 cl(cb)。 同 样 ，L(5S)= {c，cb}。 正 














Q 严格 地 讲 ， 应 该 把 RS 写 为 (R)(S)， 以 强调 R 和 5 是 分 开 的 表达 式 ， 因 为 优先 级 规则 ， 它 们 各 自 的 组 成 部 分 一 定 不 
能 混合 在 一 起 。 这 种 情况 与 我 们 将 表达 式 wix 与 y+z 相 乘 时 类 似 , 一 定 要 将 积 写 为 (wt+x)Q+z)。 请 注意 ， 因 为 乘法 
要 先 于 加 法 计算 ， 所 以 如 果 把 括号 去 掉 ， 得 到 的 表达 式 wtxy+z 就 不 能 解释 为 wtx 与 ytz 的 积 了 。 正 如 我 们 将 要 看 
到 的 ， 串 接 Oy 与 乘法 和 加 法 。 

@ 正如 接 下 来 将 要 看 到 的 ， 串 接 要 优先 于 取 并 ， 所 以 这 里 的 括号 是 多 余 的 。 
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则 表达 式 RS 就 是 (al(ab))( cl(cb))。 请 注意 ， 出 于 运算 优先 级 的 原因 ，R 和 S 上 的 括号 是 必要 的 。 


c bc 


a ac abc 
ab abc abbc 


图 10-25 ”形成 fa，ab} 和 {fc，cpb} 的 串 接 


要 找 出 L(RS) 中 的 字符 串 ， 就 要 将 L(R) 中 的 两 个 字符 串 与 7(5) 中 的 两 个 字符 串 一 一 配对 。 这 
一 配对 方式 如 图 10-25 所 示 。 从 ZL(R) 中 的 a 和 ZL(5) 中 的 c， 可 以 得 到 字符 串 ac。 而 字符 串 abc 可 以 
用 两 种 不 同方 式 得 到 ， 要 么 是 (a)(bc)， 要么 是 (ap)(c)。 最 后 ，L(R) 中 的 ab 与 7($) 中 的 bc 串 接 就 
得 到 字符 串 abbc。 因 此 L(RS) 就 是 {ac，abc，abbc}。 

请 注意 , 语言 L(RS) 中 的 字符 串 数量 不 可 能 大 于 L(R) 中 字符 串 数量 和 ZL(5) 中 字符 串 数量 的 积 。 
事实 上 ，ZL(RS) 中 字符 串 的 数量 刚好 就 是 这 个 积 ， 除 非 存 在 一 些 “ 巧 合 "， 也 就 是 同一 字符 串 可 
以 通过 两 种 或 多 种 不 同方 式 形成 的 情况 。 示 例 10.13 就 是 这 样 一 个 例子 ， 其 中 字符 串 abc 就 可 以 
用 两 种 方式 生成 , 因此 ZL(RS) 中 就 只 有 3 个 字符 串 , 要 比 R 和 8 的 语言 中 字符 串 数量 之 积 少 1。 同 样 ， 
语言 L(R 1 9 中 字符 串 的 数量 也 不 大 于 语言 ZR) 和 Z9) 中 字符 串 数 量 的 和 , 而 且 在 L(R) 和 ZL(5) 中 有 
相同 字符 串 时 只 可 能 比 该 和 小 。 在 讨论 这 些 运 算 符 的 代数 法 则 时 我 们 还 将 看 到 ， 正 则 表达 式 的 
取 并 和 串 接 ， 与 算术 运算 符 + 和 x 之 间 ， 存 在 一 种 相近 但 不 精确 的 类 比 。 

3. 闭 包 

第 三 个 运算 符 是 克 林 闭 包 (Kleene closure ) 或 直接 称 为 闭 包 。" 它 是 个 一 元 的 后 绥 运 算 符 ， 
也 就 是 说 ， 它 接受 一 个 操作 数 并 且 出 现在 该 操作 数 之 后 。 闭 包 是 用 星 号 表示 的 ， 所 以 R* 是 正则 
表达 式 R 的 闭 包 。 因 为 闭 包 运 算 符 有 着 最 高 的 优先 级 ， 所 以 通常 需要 在 R 两 侧 放 上 括号 ， 将 其 写 
为 (R)*。 

闭 包 运 算 符 的 作用 是 表示 “R 中 的 字符 串 没 有 出 现 或 多 次 出 现 ”。 也 就 是 说 , L(R*) 由 下 列 内 
容 组 成 。 

(1) 空 字 符 串 e ， 可 以 将 其 视 作 R 中 的 字符 串 没有 出 现 。 

(2) 在 L(R) 中 的 所 有 字符 串 ， 表 示 ZL(R) 中 的 字符 串 出 现 一 次 。 

(3) 在 L(RR) 中 的 所 有 字符 串 ， 也 就 是 L(R) 与 自身 的 串 接 ， 表 示 L(R) 中 的 字符 串 出 现 两 次 。 

(4) 在 L(RRR)、ZL(RRRR) 等 中 的 所 有 字符 串 ， 表 示 ZL(R) 中 的 字符 串 出 现 3 次 、4 次 和 更 多 次 。 

可 以 有 如 下 非 正 式 的 表示 





























R=¢ R|RR|RRR|:… 


不 过 , 一 定 要 理解 , 等 号 右 侧 的 表达 式 并 不 是 正则 表达 式 ， 因 为 它 包 含 无 数 个 取 并 运算 符 。 
而 所 有 正则 表达 式 都 是 用 有 限 数量 的 这 3 种 运算 符 构 建 的 。 


+ 示例 10.14 

设 R=a。 那么 L(R”) 是 什么 ”当然 ，e 肯定 在 该 语言 中 ， 因 为 它 一 定 在 任意 闭 包 中 。 而 ZL(R) 
中 唯一 的 字符 串 a 也 在 该 语言 中 ,还 有 ZL(RR) 中 的 aa，L(RRAR) 中 的 aaa， 等 等 。 也 就 是 说 ,，L(a*) 
是 由 含 0 个 或 多 个 a 的 字符 串 组 成 的 集合 ， 也 就 是 {fe ，a, aa, aaa,，...}。 

















QD StevenC.Kleene 最 时 撰写 了 描述 正则 表达 式 代 数 的 论文 。 
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+ 示例 10.15 

现在 设 R 是 正则 表达 式 a1b， 那 么 L(R)= {a，b}， 并 考虑 L(R*) 是 什么 。 该 语言 还 是 含有 ， 
表示 L(R) 中 字符 串 没有 出 现 。R 中 的 字符 串 出 现 一 次 就 为 L(R*) 带 来 了 {a，b}。 出 现 两 次 就 给 我 
们 4 个 字符 串 {faa，ab，ba，bb}，3 次 出 现 就 给 了 我 们 由 a 和 (或 ) b 组 成 长 度 为 3 的 8 个 字符 串 ， 
以 此 类 推 。 因 此 L(R*) 是 所 有 由 a 和 (或 ) b 组 成 的 任意 有 限 长 度 的 字符 串 。 


10.5.4 ”正则 表达 式 运算 符 的 优先 级 


正如 我 们 在 前 面 的 内 容 中 非 正 式 提 到 的 , 正则 表达 式 的 3 个 运算 符 并 、 串 接 和 闭 包 之 间 存 在 
约定 的 优先 级 次 序 。 这 一 次 序 如 下 。 

(1) 闭 包 (最 高 ); 

(2) 然后 是 串 接 ; 

(3) 然后 是 并 ( 最低 )。 

因此 ， 在 解释 任何 正则 表达 式 时 ， 首 先 要 为 财 包 运算 符 分 组 ， 也 就 是 找 出 具有 表达 式 形 式 
( 即 如 果 存 在 括号 的 话 ， 则 它们 是 配对 的 ) 的 紧邻 某 给 定 * 左 侧 的 最 短 表达 式 。 可 以 给 该 表达 式 
和 相应 的 * 加 上 一 对 括号 。 

接 下 来 ， 要 从 左边 起 考虑 串 接 运算 符 。 对 每 个 串 接 运算 符 ， 要 找到 紧邻 其 左 侧 的 最 小 表达 
式 并 找到 紧邻 其 右 侧 的 最 小 表达 式 ， 再 给 这 一 对 表达 式 加 上 括号 。 最 后 ， 要 从 左 侧 起 考虑 取 并 
运算 符 。 找 到 紧邻 每 个 取 并 运算 符 左右 的 表达 式 ， 并 这 这 一 对 中 间 有 着 取 并 符号 的 表达 式 周转 
加 上 括号 。 


+ 示例 10.16 
考虑 表达 式 albc*q。 首 先 分 析 *。 该 表达 式 中 只 有 一 个 *， 而且 在 其 左 侧 的 最 小 表达 式 为 c。 
因此 可 以 把 该 * 与 他 的 操作 数 分 到 一 组 ， 就 成 了 alb(c*)q。 
接 下 来 ， 要 考虑 上 述 表 达 式 中 的 串 接 。 共 有 两 次 串 接 ， 一 次 是 bp 和 左 括号 之 间 的 ， 另 一 次 
是 在 右 括 号 和 da 之 间 的 。 首 先 分 析 第 一 次 串 接 ， 我 们 看 到 b 就 是 紧邻 左 侧 的 ， 而 到 右 侧 就 必须 到 
将 右 插 号 包括 在 内 为 止 , 因为 表达 式 的 括号 必须 是 平衡 的 。 因 此 , 第 一 次 串 接 的 操作 数 分 别 是 b 
和 (c*)。 给 它们 周围 加 上 插 号 就 得 到 表达 式 
al(b(c*))d 
对 第 二 次 串 接 来 说 , 紧邻 其 左 的 最 短 表达 式 现在 是 (p(c *)) , 而 紧邻 其 右 的 最 短 表达 式 是 qd。 
在 给 这 次 串 接 的 操作 数 分 组 加 上 括号 后 ， 表 达 式 就 成 了 
al((b(c*))d) 
最 后 ， 必 须 考 虑 取 并 运算 。 该 表达 式 中 总 共有 一 次 取 并 运算 ， 它 的 左 操作 数 为 a， 而 其 右 
操作 数 就 是 上 述 表达 式 其 余 的 部 分 。 严 格 来 说 ， 必 须 为 整个 表达 式 再 加 上 一 层 括 号 ， 得 到 
(al(b(e*)q)) 





























不 过 最 外 层 的 括号 是 多 余 的 。 
10.5.5 ”正则 表达 式 的 其 他 一 些 示例 
在 本 节 最 后 ， 我 们 要 给 出 一 些 更 复杂 的 正则 表达 式 。 
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+ 示例 10.17 
可 以 将 示例 10.15 中 的 思路 扩展 到 “由 符号 al、as、…、a 组 成 的 任意 长 度 的 字符 串 ” 以 及 
(alla2|*…|an)* 
例如 ， 可 以 按照 以 下 方式 描述 C 语 言 标识 符 。 首 先 ， 定 义 正则 表达 式 : 
letter = A|B|...|Zlalb|...|z| 
这 就 是 说 ，C 语 言 中 的 “字母 ”包括 大 小 写 英 文字 母 和 下 划 线 。 同 样 ， 我 们 还 定义 了 正则 
表达 式 : 








digit = 0|1|...19 
那么 正则 表达 式 
letter(l[etterldigil)* 
就 表示 由 字母 、 数 字 和 下 划 线 组 成 的 所 有 不 以 数字 开头 的 字符 串 。 


+ 示例 10.18 

现在 来 考虑 一 个 更 难 写 出 的 正则 表达 式 : 在 示例 10.2 中 讨论 过 的 反弹 过 滤 需 问题 。 回 想 一 
下 ， 我 们 描述 了 这 样 一 种 自动 机 ， 粗 略 地 讲 ， 就 是 只 要 输入 的 结尾 是 一 列 1， 就 会 输出 1。 也 就 
是 说 ， 只 要 在 一 行 中 看 到 两 个 1， 就 认为 我 们 已 经 在 一 列 1 中 ,不 过 在 确定 看 到 的 是 一 列 1 后 ， 
个 0 的 出 现 并 不 会 让 我 们 推翻 这 一 结论 。 因 此 ， 每 当 输 入 的 结尾 有 由 两 个 1 组 成 的 序列 时 ， 只 要 
它 后 面 跟 上 的 内 容 中 每 个 0 之 后 要 人 么 立即 跟 上 一 个 1, 要 么 是 当前 为 止 看 到 的 最 后 一 个 输入 字符 ， 
示例 10.2 中 自动 机 的 输出 就 是 1。 可 以 用 如 下 正则 表达 式 表示 这 种 情况 。 

(011)*11(1101)*(e 10) 

要 理解 该 正则 表达 式 ， 首 先 要 注意 到 (011)* 表 示 由 0 和 1 组 成 的 任意 字符 串 。 这 些 字符 串 后 
面 一 定 要 跟 上 两 个 1， 就 如 表达 式 11 所 表示 的 。 因 此 (011) *11 就 是 所 有 由 0 和 1 组 成 有 结尾 ( 至 
少 ) 有 两 个 1 的 字符 串 。 

接 下 来 (0101)* 表 示 所 有 由 0 和 1] 组成， 而 且 其 中 所 有 0 后 面 都 跟着 1 的 字符 串 。 也 就 是 ， 该 
表达 式 语 言 中 的 字符 串 是 以 任意 次 序 串 接 任意 数量 的 字符 串 1 和 01 构 成 的 。 尽 管 1 让 我 们 在 任意 
时 刻 都 可 以 向 正在 形成 的 字符 串 添加 一 个 1， 不 过 01 强 人 迫 我 们 在 任何 0 之 后 都 加 上 一 个 1。 因 此 
表达 式 (011)*11(1101)* 表 示 所 有 由 0 和 1 组 成 的 ,以 两 个 1 后 面 加 上 其 中 的 0 都 要 立即 加 上 一 个 1 
的 任意 序列 结尾 的 字符 串 。 而 最 后 的 因子 (e10) 表 示 “ 可 选 的 0”， 也 就 是 说 ， 刚 刚 描述 的 字符 
串 后 面 可 能 还 有 一 个 0， 也 可 能 没有 ， 要 看 我 们 的 选择 。 


10.5.6 习题 


(1) 在 示例 10.13 中 ， 我 们 描述 了 正则 表达 式 (alab) (clcb) ， 并 看 到 它 的 语言 是 由 ac、abc 和 abbc 这 
3 个 字符 串 组 成 的 ， 也 就 是 说 ,一 个 a 和 一 个 c， 中间 被 0 到 2 个 b 分 隔 开 。 再 写 两 个 定义 该 语言 的 正 
则 表达 式 。 

(2) 写 出 定义 下 列 语言 的 正则 表达 式 。 

(a) 对 应 6 个 C 语 言 比 较 运 算 符 =、<=、<、>=、> 和 != 的 字符 串 。 
(b) 所 有 由 0 和 1 组 成 且 结 尾 为 0 的 字符 串 。 

(c) 所 有 由 0 和 1 组 成 且 至 少 有 一 个 1 的 字符 串 。 

(d) 所 有 由 0 和 1 组 成 且 至 多 有 一 个 1 的 字符 串 。 

(e) 所 有 由 0 和 1 组 成 且 至 右 起 第 三 位 是 1 的 字符 串 。 

(G 所 有 由 小 写字 母 按 已 排序 次 序 组 成 的 字符 串 。 
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(3)* 写 出 定义 下 列 语言 的 正则 表达 式 。 
(a) 所 有 由 a 和 ?pb 组 成 ， 满 足 其 中 由 a 组 成 的 子 序列 长 度 都 是 偶数 的 字符 串 。 也 就 是 说 ， 诸 如 
bbbaabaaaa、aaaabb 和 e 这 样 的 字符 串 ， 而 abbabaa 和 aaa 就 不 是 。 
(b) 由 C 语 言 中 float 类 型 的 数字 表示 的 字符 串 。 
(c) 由 0 和 1 组 成 且 具 有 偶 校 验 ( 即 含 偶 数 个 1 ) 的 字符 串 。 提 示 : 将 偶 校 验 字 符 串 视 作 具有 偶 校 验 
的 基本 字符 串 〈 要 么 是 一 个 0， 要 人 么 是 只 由 0 分 隅 的 一 对 1 ) 的 串 接 。 
(4) ** 写 出 定义 下 列 语言 的 正则 表达 式 。 
(a) 不 是 关键 字 的 C 语 言 标 识 符 组 成 的 集合 。 如 果 忘 记 了 某 些 关 键 字 也 是 没关系 的 ， 本 题 的 重点 在 
于 表示 那些 不 在 某 个 相当 大 的 字符 串 集 合 中 的 字符 串 。 
(b) 所 有 由 a、b 和 c 组 成 ， 而 且 满 足 任何 两 个 连续 位 置 上 的 字母 都 不 相同 的 字符 串 。 
(c) 由 两 个 不 同 的 小 写字 母 形成 的 所 有 字符 串 构 成 的 集合 。 提 示 : 大 家 可 以 用 “ 亦 力 ”来 解决 问 
题 ， 不 过 用 两 个 不 同 的 字母 构成 的 字母 对 有 650 个 。 更 好 的 思路 是 进行 一 些 分 组 。 例 如 ， 相 对 
较 短 的 表达 式 (alb1…1lmamalol…1z) 就 能 覆盖 这 650 个 字母 对 中 的 169 个 。 
(d) 所 有 由 二 进 制 数字 0 和 1 组 成 的 ， 表 示 为 3 的 倍数 的 整数 的 字符 串 。 
(5) 根据 取 并 、 串 接 和 闭 包 运算 符 的 优先 级 ， 为 以 下 正则 表达 式 加 上 括号 ， 以 表示 操作 数 的 恰当 
分 组 。 
(a) albclde 
(b) alb*| (alb)*a 
(6) 从 下 列 正则 表达 式 中 删除 多 余 的 括号 ， 也 就 是 说 ， 删 除 那些 分 组 可 以 由 运算 符 的 优先 级 以 及 取 并 
和 串 接 的 结合 性 ( 因此 为 邻接 的 取 并 或 邻接 的 串 接 分 组 是 无 关 紧 要 的 ) 暗示 出 的 括号。 
(a) (ab)(cq) 
(b) (al (b(c)*)) 
(c) (((a) lb(cld)) 
(7)* 描述 由 以 下 正则 表达 式 定 义 的 语言 。 
(a) Ole 
(b) ea 
(c) (alb)* 
(d) (a*b*)* 
(e) (a*ba*b)*a* 
(f) e* 
(g) R**， 其 中 R 是 任意 正则 表达 式 。 

















10.6 UNIX 对 正则 表达 式 的 扩展 


UNIX 操 作 系 统 中 有 不 少 命令 利用 了 类 似 正则 表达 式 的 表示 法 来 描述 模式 。 即 便 对 UNIX 操 
作 系 统 与 其 中 的 大 部 分 命令 并 不 熟悉 ， 了 解 这 些 表示 法 也 还 是 很 实用 的 。 我 们 发 现 正 则 表达 式 
至 少 用 在 如 下 3 类 命令 中 。 

(1) 编辑 器 。UNIX 编 辑 器 ed 和 vi ， 以 及 大 多 数 现代 文本 编辑 器 ， 让 用 户 可 以 在 找到 某 给 定 
模式 实例 的 位 置 扫描 文本 。 这 一 模式 是 由 正则 表达 式 指定 的 ， 虽然 没有 一 般 的 取 并 运算 符 ， 只 
有 下 面 将 要 讨论 的 “字符 类 ”。 

(2) 模式 匹配 程序 grep 及 类 似 程 序 。UNIX 命 令 grep 会 对 文件 进行 扫描 ， 检 查 文件 的 每 一 
行 。 如 果 该 行 包含 某 个 能 与 由 正则 表达 式 指定 的 模式 匹配 的 子囊 ,就 将 该 行 打 印 出 来 (grep 代 
表 globally search for regular expression and print， 即 全 局 查找 正则 表达 式 并 打印 )。grep 命 令 本 
身 只 接受 正则 表达 式 的 子 集 ， 而 扩展 的 命令 egrep 则 可 以 接受 完整 的 正则 表达 式 表 示 ， 而 且 包 
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含 了 一 些 其 他 的 扩展 。 命 令 awk 允 许 我 们 进行 全 面 的 正则 表达 式 搜索 ， 并 且 把 文本 行当 作 关 系 
的 元 组 来 处 理 ， 从 而 使 我 们 可 以 对 文件 执行 选择 和 投影 这 样 的 关系 代数 运算 。 

(3) 词法 分 析 。UNIX 命 令 lex 对 编写 编译 带 代 码 及 类 似 任务 而 言 是 很 使 用 的 。 编 译 带 第 一 
件 必须 完成 的 事 就 是 将 程序 分 割 为 一 个 个 标记 ( token )， 它 们 是 逻辑 上 结合 在 一 起 的 子 字符 串 。 
标记 的 例子 包括 标识 符 、 和 常量、then 这 样 的 关键 字 ， 以 及 + 或 <= 这 样 的 运算 符 。 每 种 标记 类 型 
都 可 以 由 一 个 正则 表达 式 来 指定 ,比方 说 , 示例 10.17 就 展示 了 如 何 指定 “标识 符 ” 标记 类 。1lex 
命令 让 用 户 可 以 用 正则 表达 式 指定 标记 类 。 这 样 就 形成 了 可 以 用 作词 法 分 析 器 的 程序 ， 也 就 是 
可 以 把 输入 分 解 为 标记 的 程序 。 





A 


10.6.1 字符 类 

我 们 经 常 需要 写 出 表示 字符 集合 , 或 者 严格 地 讲 ， 是 表示 长 度 为 1 的 字符 串 ( 每 个 字符 串 都 
是 由 集合 中 不 同 的 字符 构成 ) 组 成 的 集合 的 正则 表达 式 。 因 此 ， 在 示例 10.17 中 ， 我们 定义 了 表 
达 式 letter 表 示 任 何 由 一 个 大 写字 母 或 小 写字 母 组 成 的 字符 串 , 并 定义 了 表达 式 digit 表 示 任 何 由 
一 个 数字 构成 的 字符 串 。 这 些 表 达 式 都 是 相当 长 的 ， 而 UNIX 提 供 了 一 些 重要 的 简写 。 

首先 ， 可 以 用 方 括号 把 任意 字符 表 括 起 来 ， 用 来 代表 对 这 些 字母 取 并 的 正则 表达 式 。 这 样 
的 表达 式 就 叫 作 字符 类 。 例 如 ， 表 达 式 [aghinostw] 表 示 出 现在 单词 washington 中 的 字母 组 
成 的 集合 ， 而 [aghinostw]* 则 表示 只 由 这 些 字 母 形成 的 字符 串 所 构成 的 集合 。 

其 次 ,我们 并 非 总 是 需要 明确 地 列 出 所 有 的 字符 。 回 想 一 下 ， 字 母 几乎 一 直 都 是 用 ASCIHI 
编码 的 。 这 种 编码 会 为 各 种 字符 指定 相应 的 位 串 (很 自然 地 就 可 以 解释 为 整数 ), 而 且 它 是 以 一 
种 合理 的 方式 来 完成 这 一 工作 的 。 例 如 ，ASCII 编 码 为 大 写字 母 分 配 了 连续 的 整数 。 同 样 ， 它 
也 为 小 写字 母 以 及 数字 分 配 了 连续 的 整数 。 

如 果 在 两 个 字符 间 加 上 和 破 折 号 ， 就 不 仅 表示 这 些 字 符 ， 而 且 表 示 了 编码 在 这 两 个 字符 编码 
之 间 的 所 有 字符 。 


+ 示例 10.19 
我 们 可 以 通过 [A-za-z] 定 义 大 写字 母 与 小 写字 母 。 前 3 个 字符 A-z 表 示 编 码 处 于 A 和 z 之 间 
的 所 有 字符 ， 也 就 是 所 有 的 大 写字 母 。 而 接 下 来 的 3 个 字符 a-z 则 表示 所 有 的 小 写字 母 。 
顺便 提 一 句 ， 因 为 破 折 号 有 这 样 一 种 特殊 含义 ， 所 以 如 果 想 要 定义 包含 -的 字符 类 ， 就 一 
定 要 谨慎 行事 。 必 须 把 破 折 号 放 在 这 列 字 符 的 第 一 个 位 置 或 最 后 一 个 位 置 。 例 如 ， 可 以 通过 
[-+*/ ] 来 指定 4 四 种 算术 运算 符 组 成 的 集合 , 但 如 果 写 成 [+-*/ ] 的 形式 就 是 错误 的 , 因为 +-* 
这 样 的 范围 会 表示 编码 在 + 和 * 的 编码 之 间 的 所 有 字符 。 


10.6.2 行 的 开头 和 结尾 


因为 UNIX 命 令 经 常 要 处 理 单行 文本 ， 所 以 UNIX 正 则 表达 式 表 示 法 中 包含 了 用 于 表示 行 的 
开头 和 结尾 的 特殊 符号 。 符 号 ^ 表 示 行 的 开头 ， 而 $s 表示 行 的 结尾 。 


+ 示例 10.20 

10.3 节 图 10-12 中 的 自动 机 是 从 一 行 的 开头 处 启动 的 ， 它 接受 的 文本 行 刚好 是 那些 只 由 单词 
washington 中 的 字母 组 成 的 文本 行 。 可 以 将 这 种 模式 表示 为 UNX 正 则 表达 式 : 
^[aghinostwl*$。 口 头 上 讲 ， 该 模式 就 是 “ 行 的 开头 ， 后 面 跟 上 由 单词 washington 中 的 字母 组 
成 的 任意 序列 ， 再 加 上 行 的 结尾 ”。 
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举 个 这 种 正则 表达 式 使 用 方式 的 例子 ，UNIX 命 令 行 : 
grep'^[aghinostw]*$ /usr/dict/words 

将 打印 出 词典 中 所 有 只 由 来 自 washington 的 字符 组 成 的 单词 。 在 这 种 情况 下 ，UNIX 要 求 该 
正则 表达 式 被 写 为 引用 的 字符 串 。 这 一 命令 的 效果 就 是 指定 的 文件 /usr/dict/words 中 每 一 
行 都 会 被 检查 。 如 有 果 它 含有 任何 处 在 由 该 正则 表达 式 表示 的 字符 串 集合 中 的 子 字符 串 ， 那 么 这 
一 行 就 要 被 打印 出 来 ， 否 则 这 一 行 就 不 会 被 打印 。 请 注意 ， 这 一 行 的 开头 符号 与 结尾 符号 已 然 
存在 了 。 假 设 它们 不 存在 。 因 为 空 字符 串 是 在 由 正则 表达 式 [aghinostw]* 表 示 的 语言 中 的 ， 
所 以 我 们 会 发 现 每 一 行 都 有 一 个 子 字符 串 〈 即 e ) 位 于 该 正则 表达 式 的 语言 中 ， 因 此 每 一 行 都 
会 被 打印 出 来 。 























为 字符 赋予 字面 意义 

顺便 说 一 下 ， 因 为 字符 ^ 和 $ 在 正则 表达 式 中 被 赋予 了 特殊 意义 ， 所 以 看 起 来 没 办 法 在 
UNIX 正 则 表达 式 中 指定 这 些 字符 本 身 了 。 不 过 ，UNIX 用 到 了 反 斜 杠 \， 作 为 转 义 字符 。 如 果 
我 们 在 字符 ^ 或 $ 之 前 加 上 反 斜 杠 , 那 么 这 两 个 字符 形成 的 组 合 就 会 被 解释 为 第 二 个 字符 的 字面 
意义 ， 而 不 是 其 特殊 含义 。 例 如 \$ 表 示 UNIX 正 则 表达 式 中 的 $ 字 符 。 同 样 ， 两 道 反 斜 杠 就 被 
解释 为 一 个 反 斜 枉 ， 而 不 含有 其 转 义 字符 的 特殊 意义 。 而 UNIX 正 则 表达 式 中 的 字符 串 \\S 表 
示 的 是 反 针 杠 字符 后 面 跟 上 行 的 结尾 。 

还 有 不 少 其 他 的 字符 也 被 UNIX 在 某 些 情形 下 赋予 了 特殊 意义 ， 而 这 些 字符 也 总 是 能 表示 
它们 的 字面 意义 ， 也 就 是 ， 通 过 在 它们 之 前 使 用 反 斜 杠 来 “ 除 掉 ”它们 的 特殊 意义 。 例 如 ， 只 
有 这 样 处 理 方 括号 ， 方 括号 在 UNIX 正 则 表达 式 中 才 不 会 被 解释 为 字符 类 分 隔 符 。 





10.6.3 ”通配符 
符号 .在 UNIX 正 则 表达 式 中 代表 “ 除 换 行 符 之 外 的 任意 字符 ”。 


+ 示例 10.21 

正则 表达 式 

表示 按 次 序 包 含 5 个 元 音字 母 的 所 有 字符 串 。 我 们 可 以 利用 grep 与 该 正则 表达 式 来 扫描 词 
典 ， 碍 找 单词 中 5 个 元 音字 母 按 递 增 次 序 出 现 的 所 有 单词 。 不 过 ， 如 果 忽略 掉 开 头 和 结尾 位 置 
的 .*， 处 理 将 更 具 效 率 , 因为 grep 是 按 子 字符 串 搜 索 指 定 的 模式 ， 而 不 是 整 行 搜索 ， 除 非 我 们 
显 式 地 包含 了 表示 行 开 头 和 行 结尾 的 符号 。 因 此 命令 

grep'a.xe.xl.xu' /use/dict/words 

将 会 找到 含有 子 序 列 aeiou 的 所 有 单词 并 将 其 打印 出 来 。 

这 些 点 号 会 匹配 除 字 母 之 外 的 字符 ， 这 一 实情 并 不 重要 ， 因 为 在 /usr/dict/words 文 件 
中 除了 字符 和 换行 符 之 外 没有 其 他 字符 。 不 过 ， 如 果 点 号 可 以 匹配 换行 符 ， 那 么 这 一 正则 表达 
式 就 会 允许 grep 一 次 使 用 多 行 来 找 出 依次 出 现 的 5 个 元 音字 母 。 不 过 像 本 例 这 样 的 例子 都 是 点 
号 被 定义 为 不 匹配 换行 符 的 例子 。 
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10.6.4 ”额外 的 运算 符 

UNIX 命 令 awk 和 egrep 中 的 正则 表达 式 还 含有 一 些 额 外 的 运算 符 ， 具 体 如 下 。 

(1) 与 grep 不 同 的 是 ，awk 和 egrep 命 令 还 允许 取 并 运算 符 | 出 现在 它们 的 正则 表达 式 中 。 

(2) 一 元 后 级 运算 符 ? 和 ' 没 有 允许 我 们 定义 额外 的 语言 , 但 它们 通常 会 让 表示 语言 的 工作 变 
得 更 简单 。 如 果 R 是 正则 表达 式 ， 则 R? 代 表 e|R ， 也 就 是 可 选 的 R。 所 以 L(RD) 是 L(R)Ut{e}。R' 
代表 RR*， 或 者 等 价 地 讲 就 是 “R 中 的 单词 出 现 一 次 或 多 次 ”。 因 此 ,，L(R’)=L(R)UL(RR)U 
L(RRR)… 。 特 别 要 说 的 是 ， 如 果 e 在 L(R) 中 ， 那 么 L(R') 和 L(R*) 表 示 相 同 的 语言 。 而 如 果 e 不 
在 L(R) 中 ， 那 么 L(R') 就 表示 L(R )-{e }。 运 算 符 ?和 与 * 有 着 相同 的 结合 性 与 优先 级 。 


+ 示例 10.22 

假设 我 们 想 通 过 正则 表达 式 来 指定 由 非 空 数字 串 与 一 个 小 数 点 组 成 的 实数 。 将 该 表达 式 写 
为 [0-9]*\.[0-9]* 是 不 正确 的 ， 因 为 这 样 一 来 ， 只 由 一 个 点 号 组 成 的 字符 串 也 会 被 视 作 实数 。 
该 表达 式 利用 egrep 的 一 种 写法 是 

[0-9]’' \. [0-9]*\.[0-9] 

在 这 里 ， 取 并 的 第 一 项 涵盖 了 那些 小 数 点 左 侧 至 少 有 一 个 数字 的 实数 ， 而 第 二 项 则 涵盖 了 
以 小 数 点 开头 ， 因 此 在 小 数 点 后 必须 至 少 有 一 位 数字 的 那些 实数 。 请 注意 ， 放 在 点 号 之 前 的 反 
斜 杠 是 为 了 表明 这 里 的 点 号 不 具有 约定 的 “通配符 ”含义 。 


+ 示例 10.23 

利用 如 下 egrep 命 令 可 以 扫描 输入 中 那些 字母 严格 按照 字母 表 增 序 排列 的 行 。 

egrep ”~a?b?c?d?e?f?g?h?i7?j?k?1?m?n?o7?p?q?Tr?Ss?t?u?V?W?X?y?Z?$， 

也 就 是 说 ， 我 们 会 扫描 每 一 行 ， 看 看 在 行 的 开头 和 结尾 之 间 是 否 有 可 选 的 a、 可 选 的 p， 等 
等 。 例 如 ， 含 有 单词 adept 的 一 行 就 能 匹 该 表达 式 ， 因 为 a、d、e、P 和 ft 之 后 的 ?可 以 解释 为 “出 
现 一 次 ”， 而 其 他 的 ?可 以 解释 为 “没有 出 现 ”， 也 就 是 e 。 


10.6.5 ”习题 


(1) 为 以 下 字符 类 写 出 表达 式 。 
(a) 所 有 属于 C 语 言 运算 符 和 标点 符 的 字符 ， 例 如 + 和 圆 插 号。 
(b) 所 有 小 写 元 音字 母 。 
(c) 所 有 小 写 辅 音字 母 。 
(2)* 如 果 可 以 使 用 UNIX， 编 写 egrep 程 序 检查 /usr/dict/words 文 件 ， 并 找到 下 列 单词 . 
(a) 所 有 以 dous 结 尾 的 单词 ; 
(b) 所 有 只 含 一 个 元 音字 母 的 单词 ; 
(c) 所 有 原音 字母 与 辅音 字母 交替 出 现 的 单词 ; 
(d) 所 有 含 四 个 或 更 多 个 连续 辅音 字母 的 单词 。 


10.7 正则 表达 式 的 代数 法 则 


两 个 正则 表达 式 是 可 以 表示 同一 语言 的 ， 就 像 两 个 算术 表达 式 可 以 表示 其 操作 数 的 相同 也 
数 那 样 。 举 例 来 说 ，x+y 和 y+tx 这 两 个 表达 式 就 表示 x 和 y 的 相同 函数 。 同 样 ， 不 管用 什么 正则 表 
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达 式 来 替换 R 和 S， 正则 表达 式 RIS 和 SIR 都 表示 同一 语言 , 证 据 就 是 取 并 运算 也 是 具有 交换 性 的 。 

简化 正则 表达 式 往往 是 很 实用 的 。 我 们 很 快 就 会 看 到 ， 在 根据 自动 机 构造 正则 表达 式 时 ， 
经 常会 构造 出 过 于 复杂 的 正则 表达 式 。 代 数 等 价 可 以 让 我 们 “简化 ”表达 式 ， 也 就 是 说 ， 把 一 
个 正则 表达 式 蔡 换 为 另 一 个 操作 数 和 【或 ) 运算 符 更 少 却 又 表示 相同 语言 的 正则 表达 式 。 这 一 
过 程 类 似 于 在 处 理 算术 表达 式 时 对 繁 兄 的 表达 式 进 行 的 那些 简化 。 例 如 ， 可 以 将 两 个 很 大 的 多 
项 式 相 乘 ， 然 后 通过 分 组 相似 项 来 简化 结果 。 再 比如 ,我 们 在 8.9 节 中 简化 了 关系 代数 表达 式 从 
而 获得 更 快 的 求 值 速 度 。 

如 果 L(R)=L(S)， 就 说 两 个 正则 表达 式 R 和 Ss 是 等 价 的 ， 记 作 R=S 。 如 果 这 样 的 话 ， 可 以 说 
R=S 是 一 种 等 价 。 在 接 下 来 的 内 容 中 , 我们 将 假设 R、$ 和 7 是 任意 的 正则 表达 式 ， 并 以 这 些 操 
作 数 来 陈述 要 讨论 的 等 价 关 系 。 

















等 价 的 证 明 


在 本 节 中 ,我 们 要 证 明 若 干涉 及 正则 表达 式 的 等 价 关 系 。 回 想 一 下 ， 两 个 正则 表达 式 的 等 
价 是 说 ,不管 为 其 变量 替换 怎样 的 语言 ， 这 两 个 表达 式 的 语言 都 是 相等 的 。 因 此 我 们 可 以 通过 
证 明 两 种 语言 ， 也 就 是 两 个 字符 串 集合 的 相等 性 ， 来 证 明正 则 表达 式 的 等 价 。 一 般 而 言 ， 要 通 
过 证 明 两 个 方向 上 的 包含 关系 来 证 明 集 合 8 和 集合 5, 是 等 价 的 。 也 就 是 说 , 证 明 S cS,， 还 
要 证 明 9 CS。 两 个 方向 对 证 明 集合 相等 都 是 必要 的 。 





10.7.1 取 并 和 串 接 与 加 法 和 乘法 的 类 比 


在 本 节 中 ， 我 们 要 列举 与 正则 表达 式 的 取 并 、 串 接 和 闭 包 运 算 符 有 关 的 最 重要 的 那些 等 价 
关系 。 首 先 要 从 取 并 和 串 接 运算 与 加 法 和 乘法 运算 的 类 比 开 始 。 正 如 我 们 将 要 看 到 ， 这 种 类 比 
并 不 是 很 精确 ， 主 要 因为 串 接 是 不 具备 交换 性 的 ， 而 乘法 当然 是 具备 交换 性 的 。 不 过 ， 这 两 对 
运算 之 间 还 是 存在 诸多 相似 性 。 

首先 ， 取 并 和 串 接 都 具有 单位 元 。 取 并 运算 的 单位 元 是 必 ， 而 串 接 运算 的 单位 元 是 e 。 

(1) 取 并 的 单位 元 。(@IR) =(RIO=R。 

(2) 串 接 的 单位 元 。eR= Re=R 。 

从 空 集 和 取 并 的 定义 中 应 该 不 难看 出 (1) 成 立 的 原因 。 要 知道 (2) 成 立 的 原因 ， 如 果 字 符 串 x 
在 ZeR) 中 ， 那么 x 就 是 L(e) 中 某 个 字符 串 与 LOR) 中 某 个 字符 串 r 的 串 接 。 不 过 Ze) 中 唯一 的 字 
符 串 就 是 e 本身 ， 因 此 可 知 x= er 。 不 过 , 空 字符 串 与 任意 字符 串 * 串 接 的 结果 都 是 x 本 身 ， 所 以 
X=r。 也 就 是 说 x 在 L(R) 中 。 同 样 可 以 看 到 ， 如 果 x 在 L(Re) 中 ， 那 么 x 也 在 L(R) 中 。 

要 证 明 等 价 对 (2)， 不 仅 要 证 明 L(eR) 和 L(Re) 中 的 每 个 字符 串 都 在 L(R) 中 ， 而 且 要 证 明 反 
向 的 命题 ， 也 就 是 L(R) 中 的 每 个 字符 串 都 在 L(eR) 和 LI(Re) 中 。 如 果 r 在 L(R) 中 ， 那 么 er 就 在 
L(eR) 中 。 不 过 er = r+， 所 以 r 在 L(eR) 中 。 同 样 的 推理 告诉 我 们 x 也 在 L(Re) 中 。 因 此 就 证 明了 
L(R) 和 LeR) 是 相同 的 语言 ， 而 且 L(R) 和 ZL(Re) 是 相同 的 语言 ， 这 就 是 (2) 中 的 等 价 关系 。 

因此 儿 与 算术 中 的 0 是 类 似 的 ， 而 e 则 与 1 是 类 似 的 。 还 存在 男 一 种 类 比 ， 名 是 串 接 的 零 元 
( annihilator )， 也 就 是 

(3) 串 接 的 零 元 。CR= RG = 名 。 换 句 话 说 ， 当 将 空 集 与 任何 内 容 串 接 时 , 得 到 的 都 是 空 集 。 
类 似 地 ，0 是 乘法 运算 的 零 元 ， 因 为 0xx=xx0=0 。 
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可 以 通过 以 下 方式 验证 (3) 的 真实 性 。 为 了 让 某 个 字符 串 x 出 现在 L(GR) 中 ,就 要 用 ZL() 中 
的 字符 串 串 接 ZL(R) 中 的 字符 串 。 因 为 L(@) 中 是 不 含 字符 串 的 ， 所 以 我 们 没 办 法 形成 xz。 类 似 的 
论证 也 可 以 证 明 CRO) 也 必定 为 空 。 

接 下 来 的 等 价 关系 是 我 们 在 第 7 章 中 讨论 过 的 并 集运 算 的 交换 律 和 结合 律 。 

(4) 取 并 的 交换 律 。(R|S)=(S|R)。 

(5) 取 并 的 结合 律 。((R|S)| 7)=(RI(SI7T))。 

正如 我 们 提 过 的 ， 串 接 也 是 有 结合 性 的 。 也 就 是 

(6) 串 接 的 结合 律 。((RSs) 7)=(R(57))。 

要 知道 (6) 为 何 成 立 ， 先 假设 字符 串 x 在 L((RS)T) 中， 那么 x 就 是 由 L(RS) 中 的 某 字符 串 y 和 LL(7) 
中 某 字符 串 健 接 而 成 。 还 有 ，y 一 定 是 由 L(R) 中 的 某 字符 串 x 和 1L(5) 中 的 某 字符 串 s 串 接 而 成 ， 因 此 
有 x=yt=rst。 现 在 考虑 L(R(ST)) 。 字 符 串 s[ 一 定 在 LD 中， 因此 rst, 也 就 是 x, 是 在 L(R(ST)) 
中 的 。 因此 ZL((RS) 工 ) 中 的 每 个 字符 串 x 都 一 定 也 在 ZL(R(S7T)) 中 。 相似 的 论证 告诉 我 们 L(R(57)) 
中 的 每 个 字符 串 也 一 定 在 ZL((RS) 7) 中 。 因 此 这 两 种 语言 是 相同 的 ， 所 以 等 价 关系 (6) 成 立 。 

(7) 串 接 对 取 并 的 左 分 配 律 。(R(S| 7))= (RSIR7) 。 

(8) 串 接 对 取 并 的 右 分 配 律 。((S|7T)R)= (SR|TR)。 

我 们 看 看 (7) 为 什么 成 立 , (8) 成 立 的 原因 也 是 相似 的 ,就 留 作 习题 吧 。 如 果 x 在 ZL(R(S|7)) 中 ， 
那么 x=ry ， 其 中 x 在 L(R) 中 ， 而 且 y 要 人 么 在 L(5) 中 ， 要么 在 L(D) 中 ,或 者 同 在 这 两 者 中 。 如 果 y 
在 L(S) 中 ,那么 x 在 L(RS) 中 ,而 如 果 y 在 L(R) 中 ,那么 x 在 L(R7D) 中 ,不 管 是 哪 种 情况 ,x 都 是 在 L(RS|R7) 
中 。 因 此 ZL(R(S17)) 中 的 每 个 字符 串 都 在 L(RSIRD) 中 。 

我 们 还 可 以 证 明 反 向 的 命题 , 也 就 是 说 L(RSIRD) 中 的 每 个 字符 串 都 在 L(RGS17T)) 中 。 如 果 x 
在 前 者 中 ， 那 么 x 要 么 在 L(RS) 中 ， 要 么 在 L(RD) 中 。 假设 x 在 L(RS) 中 。 那 么 x = rs， 其 中 x 在 L(R) 
中 ，s 在 L(5) 中 。 因 此 s 在 L(S|D 中 ， 所 以 x 在 ZL(R(S17T)) 中 。 同 样 ， 如 果 x 在 L(RD) 中 ,就 可 以 证 明 
x 一 定 在 L(R(S17)) 中 。 现 在 我 们 就 证 明了 两 个 方向 上 的 包含 ， 这 样 就 证 明了 等 价 关系 (7)。 


10.7.2 ” 取 并 和 串 接 与 加 法 和 乘法 的 区 别 
取 并 运算 与 加 法 不 尽 相 同 的 原因 之 一 就 是 峰 等 律 。 也 就 是 说 ， 取 并 运算 是 客 等 的 ， 但 加 法 

















不 是 s 
(9) 取 并 的 窜 等 律 。(R|R)=R。 
串 接 也 与 乘法 有 重大 差异 ， 因 为 串 接 不 具 交 换 性 ， 而 实数 或 整数 的 乘法 是 满足 交换 律 的 。 
要 知道 RS 一 般 来 说 与 SR 不 等 价 的 原因 ,可 以 举 个 简单 例子 , 设 R=a 而 且 S=b, 则 有 L(RS)= {ab}， 
且 L(RS) = {ba}， 而 这 两 个 集合 是 不 同 的 。 
10.7.3 涉及 闭 包 的 等 价 

还 有 其 他 一 些 与 闭 包 运 算 符 有 关 的 实用 等 价 关 系 。 

(10) Cr =e 。 大 家 可 以 验证 该 式 的 两 边 都 表示 语言 {6 }。 

(11) RR*= R*R。 请 注意 ,该 式 两 边 都 与 10.6 市 扩展 表示 法 中 的 R 是 等 价 的 。 

(12) (RR*|e)=R*。 也 就 是 说 ，R* 和 空 字 符 串 取 并 是 与 R 等 价 的 。 
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10.7.4 习题 


(1) 证 明 等 价 关系 (8)， 即 串 接 对 取 并 的 右 分 配 律 是 成 立 的 。 

(2) 通过 变量 替换 ， 可 以 从 已 经 陈述 的 等 价 关 系 得 出 等 价 关系 CC = 名 和 ee=e ， 其 中 要 利用 到 哪些 
等 价 关系 ? 

(3) 证 明 等 价 关系 (10) 到 (12)。 

(4) 证 明 : 
(a) (RIR*)=R*; 
(b) (e|R*)=R*, 

(5) * 是 否 存 在 特定 的 正则 表达 式 R 和 满足 “交换 律 ”， 也 就 是 说 ， 对 这 些 特 殊 的 表达 式 来 说 ， 满 足 
RS = SR ? 如 果 不 存 在 ， 请 给 出 证 明 ， 如 果 存 在 ， 请 给 出 示例 。 

(6)* 正则 表达 式 中 不 需要 操作 数 g ， 除 非 没 用 就 找 不 到 语言 为 空 集 的 正则 表达 式 。 如 果 正 则 表 
达 式 中 未 出 现 名 ， 就 说 它 是 无 多 的 。 通 过 对 无 名 正则 表达 式 R 中 出 现 的 运算 符 个 数 进 行 归纳 ， 
证 明 L(R) 不 是 空 集 。 提 示 : 10.8 节 中 将 会 展示 对 正则 表达 式 中 出 现 的 运算 符 的 数量 进行 归纳 证 








明 的 示例 。 
(7) ** 通过 对 正则 表达 式 R 中 出 现 的 运算 符 的 数量 进行 归纳 证 明 : R 要 人 么 与 正则 表达 式 名 等 价 ， 要 人 么 
与 某 个 无 儿 正则 表达 式 等 价 。 


10.8 ”从 正则 表达 式 到 上 自动 机 


记得 我 们 在 10.2 节 中 对 上 自动 机 的 初步 讨论 ， 其 中 看 到 了 在 确定 自动 机 与 利用 了 “状态 ” 概 
念 (用 以 区 分 程序 中 不 同 部 分 扮演 的 角色 ) 的 程序 之 间 存 在 的 紧密 关系 。 然 后 我 们 说 过 ， 设 计 
确定 自动 机 往往 是 设计 这 类 程序 的 一 种 好 方法 。 不 过 我 们 还 看 到 ， 确 定 自 动机 可 能 难于 设计 。 
在 10.3 节 中 看 到 ， 有 时 候 设 计 非 确定 自动 机 要 更 简单 ， 而 且 子 集 构造 让 我 们 可 以 把 任意 非 确定 
自动 机 转换 成 等 价 的 确定 自动 机 。 现 在 我 们 又 知道 了 正则 表达 式 ， 接 下 来 会 看 到 ， 写 出 正则 表 
达 式 甚至 比 设 计 非 确定 自动 机 更 简单 。 

而 且 很 好 的 是 ， 存 在 某 种 方式 可 以 把 任意 正则 表达 式 转换 成 非 确定 自动 机 ， 接 着 就 可 以 使 
用 子 集 构造 将 得 到 的 非 确定 自动 机 转换 成 确定 自动 机 。 事 实 上 ， 我 们 在 10.9 中 还 会 看 到 ， 也 
能 把 任意 自动 机 转换 成 相应 的 正则 表达 式 ， 其 中 正则 表达 式 的 语言 刚好 是 自动 机 接受 的 字符 串 
集合 。 因 此 自动 机 和 正则 表达 式 有 着 一 模 一 样 的 语言 描述 能 力 。 




















并 非 所 有 语言 都 能 用 自动 机 描述 
尽管 我 们 看 到 很 多 语言 可 以 用 自动 机 或 正则 表达 式 描述 ， 但 还 是 存在 不 能 这 样 描 述 的 语 
言 。 直 觉 就 是 “自动 机 不 会 数 数 ”。 也 就 是 说 ， 如 果 为 具有 nn 个 状态 的 自动 机 提供 一 列 n 个 相同 
符号 ， 它 肯定 会 进入 同一 状态 两 次 ， 这样 它 就 不 能 确切 记 住 已 经 看 到 了 多 少 符号 。 因 此 ， 比 方 
说 自动 机 不 可 能 识别 所 有 只 由 平衡 圆 括号 组 成 的 字符 串 。 因 为 正则 表达 式 和 自动 机 定义 了 相同 
的 语言 ， 所 以 同样 不 会 有 语言 刚好 全 有 是 平衡 圆 括 号 字符 串 的 正则 表达 式 。 我 们 将 在 10.9 节 中 讨 
论 哪些 语言 是 不 可 以 用 自动 机 定义 的 。 





在 本 节 中 ， 我 们 要 完成 以 下 任务 ,说 明 如 何 把 正则 表达 式 转 换 成 自动 机 。 
(1) 引入 具有 e 转换 的 自动 机 ， 也 就 是 ， 具 有 标号 为 e 的 弧 的 自动 机 。 这 些 弧 用 在 路 径 中 ， 
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但 不 会 对 路 径 的 标号 产生 任何 影响 。 这 种 形式 的 自动 机 是 正则 表达 式 与 本 划 先 前 讨论 过 的 目 动 
机 之 间 的 中 间 体 。 

(2) 展示 如 何 把 任意 正则 表达 式 转 换 成 定义 同一 语言 的 具有 e 转换 的 自动 机 。 

(3) 展示 如 何 把 任意 具有 e 转换 的 自动 机 转换 成 接受 同一 语言 的 不 含 e 转换 的 自动 机 。 


10.8.1 具有 € 和 转 换 的 自动 机 


首先 要 将 自动 机 的 概念 扩展 到 允许 为 弧 标 记 e 。 这 样 的 自动 机 仍然 是 当 且 仅 当 从 起 始 状态 
到 接受 状态 存在 标记 为 * 的 路 径 时 才 接 受 字 符 串 *s。 不 过 请 注意 ， 空 字符 种 e 在 字符 串 中 是 “不 
可 见 的 "， 因 此 在 为 路 径 构建 标号 时 ， 我 们 其 实 删除 了 所 有 的 e ， 并 且 只 使 用 “真实 ”的 字符 。 


+ 示例 10.24 
考虑 如 图 10-26 所 示 的 具有 e 转换 的 自动 机 。 在 这 里 ， 状 态 0 是 起 始 状 态 ， 而 状态 3 是 唯一 的 
接受 状态 。 从 状态 0 到 状态 3 的 一 条 路 径 为 
0, 4, 5, 6, 7, 8, 7, 8, 9, 3 
这 些 弧 的 标号 就 构成 了 序列 








EbEECECEE 
只 要 记得 e 与 任意 其 他 字符 串 串 接 得 到 的 都 是 那个 其 他 字符 第， 就 可 以 “丢掉 ”这 些 e 得 
到 字符 串 pcc， 这 就 是 正在 考虑 的 路 径 的 标号 。 











图 10-26 ”表示 albc* 的 具有 转换 的 自动 机 


大 家 可 能 会 发 现 ， 从 状态 0 到 状态 3 的 路 径 的 标记 只 会 是 a、b、bc、bcc、bccc， 等 等 。 
表示 该 集合 的 正则 表达 式 是 a | bc*， 而 且 我 们 会 看 到 图 10-26 中 的 自动 机 可 以 自然 地 由 这 一 正 
则 表达 式 构建 而 来 。 


10.8.2 ”从 正则 表达 式 到 具有 e 转换 的 自动 机 

我 们 可 以 利用 根据 对 正则 表达 式 中 运算 符 数 量 进 行 完 全 归纳 得 出 的 算法 ， 把 正则 表达 式 转 
换 成 自动 机 。 这 一 思路 类 似 于 我 们 在 5.$ 节 中 介绍 过 的 对 树 的 结构 归纳 ， 而 且 如 果 用 正则 表达 式 
的 表达 式 树 ( 其 中 原子 操作 数 是 树叶 ， 而 运算 符 在 中 间 节 点 位 置 ) 来 表示 它们 ， 这 种 对 应 就 会 
变 得 更 加 明朗 。 要 证 明 的 命题 如 下 。 
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命题 S(n)。 如 果 R 是 含 n 个 运算 符 ， 而 且 不 含 变量 作为 原子 操作 数 的 正则 表达 式 ， 那 么 存在 
具有 e 大 换 的 自动 机 4， 只 接受 L(R) 中 的 字符 串 。 此 外 ，4 满 足 如 下 所 有 条 件 : 

(1) 只 有 一 个 接受 状态 ; 

(2) 没有 弧 通 向 它 的 起 始 状态 ; 

(3) 没有 弧 从 它 的 接受 状态 出 发 。 

依据 。 如 果 n=0， 那么 R 一 定 是 一 个 原子 操作 数 ， 它 可 能 是 名 、e， 或 是 对 应 某 个 符号 x 的 x。 
在 这 3 种 情况 下 ， 可 以 设计 满足 命题 SO) 要求 的 双 状 态 的 自动 机 ， 这 些 自 动机 如 图 10-27 所 示 。 


起 始 $ O 


(a) 对 应 合 的 自动 机 


起 始 二 € 四 


(b) 对 应 e 的 自动 机 


(c) 对 应 x 的 自动 机 
图 10-27 ”依据 情况 中 的 自动 机 


请 务必 理解 ， 这 里 为 正则 表达 式 中 出 现 的 每 个 操作 数 创建 了 新 的 自动 机 ， 而 且 所 具有 的 状态 
与 其 他 任何 自动 机 的 状态 都 不 一 样 。 例 如 ， 如 果 在 表达 式 中 出 现 3 个 a， 我 们 就 会 创建 3 个 不 同 的 
自动 机 , 总 共有 6 个 状态 , 每 个 自动 机 都 与 图 10-27c 所 示 的 自动 机 类 似 , 只 不 过 用 a 替代 了 其 中 的 x。 

图 10-27a 中 的 自动 机 显然 不 接受 任何 字符 串 ， 因 为 我 们 没 办 法 从 起 始 状态 到 达 接 受 状态 ， 
此 它 的 语言 为 名 。 图 10-27b 是 对 应 e 的 ， 因 为 它 只 接受 空 字符 串 。 图 10-27c 是 只 接受 字符 串 x 
的 自动 机 。 我 们 可 以 用 为 符号 x 选择 的 不 同 值 创 建新 的 自动 机 。 请 注意 , 这 些 自动 机 都 能 满足 上 
述 3 个 要 求 ， 只 有 一 个 接受 状态 ,没有 进入 起 始 状 态 的 弧 ， 也 没有 从 接受 状态 出 发 的 弧 。 

归纳 。 现 在 假设 SQ) 对 所 有 的 i 夺 n 都 成 立 , 也 就 是 说 , 对 任意 最 多 具有 nn 个 运算 符 的 正则 表 
达 式 R 来 说 ， 存 在 自动 机 满足 归纳 假设 的 条 件 ， 并 且 只 接受 L(R) 中 的 所 有 字符 串 。 现 在 ， 设 R 是 
具有 n+1 个 运算 符 的 正则 表达 式 。 我 们 可 以 将 注意 力 放 在 R“ 最 外 侧 ” 的 运算 符 上 ， 也 就 是 说 ， 
R 只 可 能 是 RR |R,、RR, 或 R* 这 样 的 形式 ,具体 取决 于 形成 R 时 最 后 用 到 的 那个 运算 符 是 区 别 、 
串 接 还 是 闭 包 。 

在 这 3 种 情况 的 任意 一 种 中 ，R 和 RR, 都 不 可 能 具有 n 个 以 上 运算 符 ， 因 为 R 中 有 一 个 运算 符 
不 属于 R 入 中 的 任何 一 个 。“ 因 此， 归纳 假设 在 所 有 这 3 种 情况 下 都 是 适用 于 R 和 RR 的。 我 
们 可 以 通过 依次 考虑 这 几 种 情况 来 证 明 S(n+1)。 

情况 1。 如 果 R=R |R,， 那 么 可 构建 图 10-28a 中 的 自动 机 。 取 R 和 R,， 并 添加 两 个 新 状态 
(一 个 起 始 状态 和 一 个 接受 状态 )， 从 而 构造 了 该 自动 机 。 与 R 对 应 的 自动 机 的 起 始 状 态 具 有 到 
与 RR 和 RR 对 应 的 自动 机 起 始 状 态 的 e 转换 。 这 两 个 自动 机 的 接受 状态 分 别 有 到 对 应 的 自动 机 接 
受 状态 的 e 转换 。 不 过 , 与 RR 和 RR 对 应 的 自动 机 的 起 始 状 态 与 接受 状态 不 是 构造 出 的 自动 机 的 
起 始 状态 和 接受 状态 。 

















(D 不 要 忘 了 ,即便 串 接 是 通过 并 置 操 作 数 来 表示 的 , 并 没有 可 见 的 运算 符 符 号 , 但 在 确定 R 中 出 现 了 多 少 个 运算 符 
时 ,仍然 要 将 串 接 的 使 用 记 入 运算 符 出 现 的 次 数 中 。 
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这 种 构造 之 所 以 行 得 通 ， 是 因为 从 对 应 R 的 自动 机 的 起 始 状 态 到 接受 状态 的 唯一 方式 ， 是 
沿 着 一 条 标记 为 e 的 弧 到 与 R 对 应 或 与 RR 对 应 的 自动 机 的 起 始 状 态 。 然后 必须 沿 着 所 选 自动 机 
中 的 路 径 到 达 其 接受 状态 , 之 后 经 过 e 转换 到 达 与 R 对 应 的 自动 机 的 接受 状态 。 这 一 路 径 是 由 我 
们 行经 的 自动 机 所 接收 的 某 个 字符 串 s 标 记 的 ， 因 为 我 们 从 该 自动 机 的 起 始 状 态 行 至 了 接受 状 
态 。 因 此 ，s 要 人 么 在 L(R ) 中 ,要 么 在 L( RR,) 中 ， 这 取决 于 我 们 行经 的 自动 机 到 底 是 哪个 。 因 为 我 
们 只 为 路 径 的 标号 增加 了 e ， 所 以 图 10-28a 中 的 自动 机 也 接受 s。 因 此 被 接受 的 字符 串 都 在 
ZL(R)UL(R,) 中 ， 也 就 是 在 L(R |R,) ,或 者 说 L(R) 中 。 











(a) 为 两 个 正则 表达 式 的 取 并 构造 的 自动 机 


(b) 为 两 个 正则 表达 式 的 串 接 构造 的 自动 机 





(c) 为 正则 表述 式 的 闭 包 构 造 的 自动 机 
图 10-28 ”根据 正则 表达 式 构造 自动 机 的 归纳 部 分 


情况 2。 如 果 R= RR,， 那 么 可 以 构造 如 图 10-28b 所 示 的 自动 机 。 该 自动 机 的 起 始 状 态 是 与 
RR 对 应 的 自动 机 的 起 始 状 态 。 而 它 的 接受 状态 是 与 R, 对 应 的 自动 机 的 接受 状态 。 我们 添加 了 从 
与 R 对 应 的 自动 机 的 接受 状态 到 与 R, 对 应 的 自动 机 的 起 始 状态 的 e 转换 ,第 一 个 自动 机 的 接受 
状态 不 再 是 接受 状态 ， 而 第 二 个 自动 机 的 起 始 状态 在 构造 的 自动 机 中 也 不 再 是 起 始 状态 。 

在 图 10-28b 所 示 的 自动 机 中 ， 从 起 始 状态 到 接受 状态 的 唯一 方式 如 下 : 
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(1) 顺 着 由 L(R ) 中 某 字 符 串 s 标 记 的 路 径 ， 从 起 始 状 态 到 达 与 R 对 应 的 自动 机 的 接受 状态 ; 
(2) 接着 沿 着 标记 为 e 的 路 径 到 达 与 R, 对 应 的 自动 机 的 起 始 状 态 ; 

(3) 然后 顺 着 由 L( RR, ) 中 某 字符 串 标 记 的 路 径 ， 到 达 其 接受 状态 。 

这 条 路 径 的 标号 是 st。 因 此 图 10-28b 中 的 自动 机 接受 的 刚好 是 L(R R )， 也 就 是 L(R) 中 的 字 





情况 3。 如 果 R=R*， 则 可 以 构造 如 图 10-28c 所 示 的 自动 机 。 我 们 为 与 RR 对 应 的 自动 机 添 
加 了 新 的 起 始 状态 和 接受 状态 。 这 个 新 的 起 始 状态 具有 到 新 接受 状态 的 e 转换 (所 以 字符 串 e 会 
被 接受 )， 而 且 有 到 与 RR 对 应 的 自动 机 的 起 始 状 态 的 e 转换 。 与 尺 对 应 的 自动 机 的 接受 状态 被 
赋予 了 回 到 其 起 始 状态 的 e 转换 ， 以 及 到 与 R 对 应 的 自动 机 的 接受 状态 的 ce 转换。 与 R 对 应 的 
自动 机 的 起 始 状态 与 接受 状态 不 再 是 构造 出 的 自动 机 的 起 始 状态 与 接受 状态 。 

图 10-28c 中 从 起 始 状态 到 接受 状态 的 路 径 要 么 标记 为 e (如 果 是 直接 到 达 ), 要 么 是 由 L( RR) 
中 一 个 或 多 个 字符 串 的 串 接 来 标记 ， 一 如 我 们 行经 与 R 对 应 的 自动 机 ,并且 按 自己 喜好 反复 回 
到 其 起 始 状 态 一 样 。 请 注意 ,我们 每 次 在 行经 与 R 对 应 的 自动 机 时 ， 并 不 一 定 都 要 沿 着 相同 的 
路 径 。 因 此 ， 经 过 图 10-28c 的 路 径 的 标号 刚好 是 ZL( R*)， 也 就 是 L(R) 中 的 字符 串 。 


+ 示例 10.25 

下 面 我 们 来 为 正则 表达 式 a | bc* 构 造 自动 机 。 对 应 该 正则 表达 式 的 表达 式 树 如 图 10-29 
所 示 ， 它 类 似 于 我 们 在 5.2 节 中 讨论 过 的 表达 式 树 ， 并 有 助 于 我 们 了 人 解 运算 符 应 用 到 操作 数 上 
的 次 序 。 








图 10-29 ”与 正则 表达 式 albc* 对 应 的 表达 式 树 


总 共有 3 个 叶子 节点 ， 而 且 我 们 为 每 个 叶子 节点 都 构造 了 类 似 图 10-27c 所 示 的 自动 机 实例 。 
这 些 自动 机 如 图 10-30 所 示 ， 而 且 使 用 了 与 图 10-26 所 示 的 自动 机 (正如 我 们 提 到 过 的 ， 这 是 我 
们 最 终 要 为 该 正则 表达 式 构 造 的 自动 机 ) 一 致 的 状态 。 不 过 ， 大 家 应 该 明白 ， 对 应 多 次 出 现 的 
操作 数 的 自动 机 有 着 不 同 的 状态 。 在 这 个 例子 中 ， 因 为 每 个 操作 数 都 是 不 同 的 ， 我 们 能 想到 要 
为 每 个 操作 数 使 用 不 同 状态 ， 不 过 ， 打 个 比方 说 ， 如 果 表 达 式 中 出 现 了 多 个 a， 就 要 为 每 个 a 创 
建 不 同 的 自动 机 。 

现在 必须 应 用 运算 符 并 构建 随 着 进程 更 大 的 自动 机 ,逐步 建立 起 图 10-29 中 的 树 。 最 先 应 用 
的 运算 符 是 闭 包 运算 符 , 它 是 应 用 到 操作 数 c 上 的 。 我们 利用 了 图 10-28c 中 对 应 闭 包 运 算 的 构造 
方法 。 引 入 的 新 状态 分 别称 为 状态 6 和 状态 9， 还 是 与 图 10-26 保 持 一 致 。 图 10-31 展 示 了 与 正则 
表达 式 c* 对 应 的 自动 机 。 
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"0 — © 
(a) 与 a 对 应 的 自动 机 
ss) 
(b) 与 bp 对 应 的 自动 机 


起 始 多 c @ 


(0) 与 c 对 应 的 自动 机 





图 10-30 ”对 应 a、b 和 ce 的 自动 机 





图 10-31 对 应 c* 的 自动 机 


接 下 来 对 b 和 c* 应 用 了 串 接 运算 符 。 利 用 的 是 图 10-28b 的 构造 方法 ,得 到 的 自动 机 如 图 10-32 
所 示 。 





图 10-32” 对 应 bc* 的 自动 机 


最 后 ， 我 们 对 a 和 bc* 应 用 取 并 运算 符 。 这 里 用 到 了 图 10-28a 所 示 的 构造 方法 ,而 且 将 引入 
的 新 状态 称 为 状态 0 和 状态 3， 得 到 的 自动 机 就 如 图 10-26 所 示 。 


10.8.3 消除 e 转换 


如 果 我 们 在 具有 e 转换 的 某 目 动机 的 任意 状态 * 中 ， 其 实 也 是 在 从 状态 * 治 着 由 标记 为 e 的 
弧 形 成 的 路 径 可 以 到 达 的 任意 状态 。 原 因 在 于 , 不 管 是 什么 字符 串 标记 了 到 达 状 态 * 所 经 过 的 路 
径 ， 同 样 的 字符 串 剖 是 用 e 转换 扩展 过 的 该 路 径 的 标号 。 


+ 示例 10.26 

在 图 10-26 中 ， 可 以 沿 着 标记 了 5b 的 路 径 到 达 状 态 5。 从 状态 5 起 ， 可 以 沿 着 由 标记 了 的 弧 
形成 的 路 径 到 达 状 态 6、 状 态 7、 状 态 9 和 状态 3。 因 此 ， 如 果 我 们 在 状态 5 中 ， 其 实 也 就 在 其 他 4 
个 状态 中 。 例 如 ， 因 为 状态 3 是 接受 状态 ， 所 以 也 可 以 把 状态 5 视 作 接 受 状态 ， 因 为 能 把 我 们 带 
到 状态 5 的 每 个 输入 字符 串 ， 也 能 把 我 们 带 到 状态 3， 因 此 是 可 以 被 接受 的 。 

因此 ， 要 问 的 第 一 个 问题 是 ， 从 各 状态 开始 ， 只 沿 着 e 转换 可 以 到 达 哪 些 其 他 状态 ?” 在 9.7 
节 中 ， 我 们 在 了 解 深度 优先 搜索 的 一 种 应 用 ( 可 达 性 问题 ) 时 ， 给 出 了 回答 这 一 问题 的 算法 。 
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对 这 里 的 问题 来 说 ， 要 对 表示 有 限 自 动机 的 图 进行 的 修改 ， 只 是 要 把 图 中 所 有 除 e 转换 之 外 的 
转换 删除 。 也 就 是 说 ， 对 每 个 实际 的 符号 x， 要 删除 所 有 标记 为 x 的 弧 。 然 后 从 剩 下 的 图 中 各 个 
节点 开始 进行 深度 优先 搜索 。 在 从 市 点 v 开 始 的 深度 优先 搜索 期 间 访问 过 的 节点 ， 刚 好 就 是 从 vy 
开始 只 使 用 e 转换 便 可 到 达 的 节点 组 成 的 集合 。 

回想 一 下 ， 深 度 优 先 搜索 要 花费 O (m) 的 时 间 ， 其 中 是 图 中 节点 数 和 弧 数 的 较 大 者 。 在 这 
种 情况 下 ， 如 果 图 中 有 7 个 节点 ， 要 进行 z 次 深度 优先 搜索 ， 总 共 要 花 O (mn) 的 时 间 。 不 过 ,在 
通过 在 本 节 前 面 的 内 容 中 摘 述 的 算法 从 正则 表达 式 构造 的 自动 机 中 ， 任 意 节 点 出 发 的 弧 最 多 只 
有 两 条 。 因 此 m 三 2n ， 而 且 O (mn) 就 是 0 (m7 ) 的 时 间 。 


+ 示例 10.27 

在 图 10-33 中 ， 可 以 看 到 从 图 10-26 中 删除 标记 了 由 实际 符号 a、P、c 标 记 的 3 条 弧 后 剩 下 的 
弧 。 图 10-34 中 的 表 给 出 了 图 10-33 的 可 达 性 信息 ， 也 就 是 说 第 行 和 第 7 列 的 1 就 表示 存在 从 节点 i 
到 节点 7 的 长 度 为 0 或 以 上 的 路 径 














0 | 1 1 1 

1 1 

2 1 1 

3 1 

4 1 

5 1 1 1 1 1 
6 1 1 1 1 
7 1 
8 1 1 1 1 
9 1 1 


图 10-34 图 10-33 对 应 的 可 达 性 表 


有 了 可 达 性 信息 之 后 ， 就 可 以 构造 不 会 e 转换 的 等 价目 动 机 。 思 路 就 是 把 旧 自 动机 中 具有 0 
次 或 多 次 e 转换 一 条 路 径 以 及 后 面 标记 为 实际 符号 的 一 次 转换 ， 捆 绑 成 新 自动 机 中 的 一 次 转换 。 
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每 一 次 这 样 的 转换 ， 都 会 将 我 们 市 到 图 10-27c 的 依据 规则 ( 操作 数 为 实际 符号 时 的 规则 ) 引入 的 
自动 机 中 第 二 个 状态 。 原 因 在 于 ,这些 状 态 只 有 以 真实 符号 为 标号 的 弧 才 进 入 。 因 此 , 我 们 的 新 
自动 机 只 需要 这 些 状态 ， 以 及 对 应 其 自身 状态 集 的 起 始 状 态 。 可 以 把 这 些 状态 叫 作 重 要 状态 。 

在 构造 的 新 自动 机 中 , 如 果 存 在 某 个 状态 4 满足 以 下 条 件 , 就 有 从 重要 状态 ;到 重要 状态 j 的 ， 
标号 中 含有 符号 x 的 转换 。 

(1) 从 状态 褒 痢 具有 0 次 或 多 次 e 转换 的 路 径 可 达 状 态 k。 请 注意 ,k=i 一 直 是 可 以 的 。 

(2) 在 旧 自 动机 中 ， 存 在 从 状态 f 到 状态 j， 标 记 为 x 的 转换 。 

我 们 还 必须 决定 新 自动 机 中 哪些 状态 是 接受 状态 。 正 如 上 文 提 到 过 的 ， 当 我 们 在 某 个 状态 
中 时 ， 其 实 就 是 在 由 该 状态 沿 着 标记 为 e 的 弧 所 能 到 达 的 任意 状态 中 。 因 此 如 有 果 在 旧 自 动机 中 
从 状态 ;到 其 接受 状态 之 间 存 在 由 标记 为 e 的 弧 形 成 的 路 径 ， 就 将 状态 ;作为 新 自动 机 的 接受 状 
态 。 请 注意 ， 状 态 i 本 里 可 能 就 是 旧 自 动机 的 接受 状态 ,并 因此 在 新 自动 机 中 仍然 是 接受 状态 。 


+ 示例 10.28 

我 们 来 将 图 10-26 所 示 的 自动 机 转变 为 接受 相同 语言 但 不 带 e 转换 的 自动 机 。 首 先 , 重要 状 
态 包 括 作 为 初始 状态 的 状态 0， 以 及 由 标记 了 实际 符号 的 弧 进 入 的 状态 2、 状 态 5 和 状态 8。 

首先 从 找到 状态 0 对 应 的 转换 开始 。 根 据 图 10-34， 从 状态 0 可 以 沿 着 由 标记 了 e 的 弧 构成 的 
路 径 到 达 状 态 0、 状 态 1 和 状态 4。 我 们 发 现 有 针对 a 的 从 状态 1 到 状态 2 的 转换 ， 而 且 有 针对 b 的 
从 状态 4 到 状态 5 的 转换 。 因 此 , 在 新 自动 机 中 , 存在 从 状态 0 到 状态 2 的 标记 为 a 的 转换 ， 并 存在 
从 状态 0 到 状态 $ 的 标记 为 p 的 转换 。 请 注意 ,我 们 已 经 把 图 10-26 中 的 路 径 0 一 1 一 2 和 0 一 4 一 5 
压缩 成 标记 了 这 些 路 径 上 非 e 转换 的 标号 的 转换 。 因 为 状态 0， 以 及 从 它 出 发 沿 着 以 e 标记 的 路 
径 可 达 的 状态 1 和 状态 4 都 不 是 接受 状态 ， 所 以 在 新 自动 机 中 ， 状 态 0 不 是 接受 状态 。 
































图 10-35 通过 消除 e 转换 ， 根 据 图 10-26 构 造 的 自动 机 。 请 注意 ， 该 自动 
机 只 接受 Zalbcs) 中 的 所 有 字符 串 


接 下 来 ， 考 虑 从 状态 2 出 发 的 转换 。 图 10-34 告 诉 我 们 ， 从 状态 2 出 发 ， 通 过 e 转换 只 能 到 达 
它 本 身 和 状态 3， 因 此 我 们 必须 寻找 从 状态 2 或 状态 3 出 发 针对 实际 符号 的 转换 。 因 为 没 找到 ， 所 
以 可 知 在 新 自动 机 中 没有 从 状态 2 出 发 的 转换 。 不 过 ,状态 3 是 接受 状态 , 而且 从 状态 2 经 过 e 转 
换 可 以 到 达 状 态 3， 所 以 状态 2 就 是 新 自动 机 的 接受 状态 。 

在 考虑 状态 5 时 , 图 10-34 表 明 要 查看 状态 3、 状 态 5、 状 态 6、 状 态 7 和 状态 9。 在 这 些 状 态 中 ， 
只 有 状态 7 具有 从 自身 出 发 的 非 e 转换 ， 它 被 标记 为 c， 而 且 通 向 状态 8。 因 此 ， 在 新 自动 机 中 ， 
从 状态 5 出 发 的 唯一 转换 就 是 针对 c 的 到 状态 8 的 转换 。 因 为 从 状态 5 治 着 标记 了 e 的 弧 可 以 到 达 
接受 状态 3， 所 以 我 们 把 状态 5 也 作为 新 自动 机 的 接受 状态 。 
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最 后 ,一定 要 查看 从 状态 8 出 发 的 转换 。 经 过 类 似 对 状态 5 进行 的 推理 可 以 得 出 ， 在 新 自动 
机 中 ,从 状态 8 出 发 的 唯一 转换 是 到 它 自 身 的 ,而且 被 标记 为 c。 因 此 ,状态 8 也 是 新 自动 机 的 接 
受 状态 。 

图 10-35 展 示 了 该 新 自动 机 。 请 注意 ， 它 接受 的 字符 串 集 正好 是 L(albc*) 中 的 那些 字符 串 ， 
也 就 是 将 我 们 带 到 状态 2 的 字符 串 a, 将 我 们 带 到 状态 5 的 字符 串 b, 以 及 bc、bcc、pccc 这 些 将 
我 们 带 到 状态 8 的 一 系列 字符 串 。 图 10-35 中 的 自动 机 刚好 是 确定 自动 机 。 如 果 它 不 是 ， 假 设想 
设计 可 以 识别 原 正则 表达 式 的 字符 串 的 程序 ， 就 可 以 利用 子 集 构 造 将 其 转化 为 确定 自动 机 。 

顺便 提 一 下 ， 存 在 与 图 10-35 接 受 同一 语言 的 更 加 人 简化 的 确定 自动 机 ， 该 自动 机 如 图 10-36 
所 示 。 事 实 上 ， 只 要 意识 到 状态 S 和 状态 8 是 等 价 并 可 以 被 合并 的 ， 就 可 以 得 到 这 一 改进 过 的 自 
动机 。 得 到 的 状态 就 是 图 10-36 中 的 状态 5。 








图 10-36 ”对 应 语言 L(albc*) 的 更 简单 的 自动 机 


10.8.4 习题 


(1) 为 以 下 正则 表达 式 构 造 具有 转换 的 自动 机 。 

(a) aaa。 提 示 : 请 记 住 ， 要 为 出 现 的 每 个 a 创 建新 自动 机 。 
(b) (ablac)*。 
(c) (O01111*)*, 

(2) 为 习题 (1) 中 构造 的 各 个 自动 机 找到 由 标记 为 e 的 弧 构 成 的 图 中 节点 的 可 达 集 。 请 注意 ， 在 大 家 构 
造 不 含 e 转换 的 自动 机 时 ， 只 需要 为 初始 状态 和 那些 有 非 e 转换 进入 的 状态 构造 可 达 状 态 。 

(3) 为 习题 (1) 中 构造 的 各 个 自动 机 构造 不 含 e 转换 的 等 价 自动 机 。 

(4) 习题 (3) 得 出 的 自动 机 中 哪些 是 确定 自动 机 ? 为 其 中 那些 非 确定 自动 机 构造 等 价 的 确定 自动 机 。 

(5)* 对 由 习题 (3) 和 习题 (4) 构 造 的 确定 自动 机 而 言 ， 是 否 存 在 状态 更 少 的 等 价 确定 自动 机 ? 如 果 有 ， 
找 出 状态 最 少 的 那个 。 

(6) * 我 们 可 以 扩展 从 正则 表达 式 构造 含 e 转换 的 自动 机 的 过 程 ， 将 正则 表达 式 的 范围 扩大 到 包含 那 
些 使 用 了 10.7 节 中 扩展 过 的 运算 符 的 表达 式 。 这 一 命题 从 原则 上 讲 是 成 立 的 ， 因 为 那些 扩展 都 是 
“原始 ”正则 表达 式 的 简略 形式 ， 我 们 只 是 用 扩展 的 运算 符 奉 代 了 原 有 的 表达 式 而 已 。 不 过 ， 还 
可 以 直接 把 扩展 过 的 运算 符 融 入 到 我 们 的 构造 过 程 中 。 说 明 如 何 修改 构造 过 程 以 涵盖 下 列 运 
算 符 : 

(a) ? 运算 符 (不 出 现 或 出 现 1 次 ) ; 
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(b) “运算 符 (出 现 1 次 或 更 多 次 ) ; 
(c) 字符 类 。 

(07) 我们 可 以 修改 把 正则 表达 式 转 化 为 自动 机 的 算法 中 对 应 串 接 的 情况 ,在 图 10-28b 中 ,引入 了 从 与 R 
对 应 自动 机 的 接受 状态 到 与 R, 对 应 自动 机 的 初始 状态 的 e 转换 。 另 一 种 方式 就 是 按照 图 10-37 所 示 


的 方式 合并 R 的 接受 状态 到 R, 的 初始 状态 。 使 用 旧 算 法 与 修改 过 的 算法 为 正则 表达 式 ab*c 构 造 


目 动 机 。 
OO 


图 10-37 男 一 种 与 两 个 正则 表达 式 的 串 接 对 应 的 自动 机 


10.9 ”从 目 动机 到 正则 表达 式 


本 节 中 还 要 展示 自动 机 与 正则 表达 式 等 价 性 的 另 一 半 ,， 证 实 对 每 个 自动 机 4， 都 存在 语言 
刚好 是 4 所 接受 的 字符 串 集 合 的 正则 表达 式 。 尽 管 我 们 一 般 会 使 用 10.8 节 中 的 构造 过 程 ， 其 中 要 
把 正则 表达 式 形式 的 “设计 ”转化 为 确定 自动 机 形式 的 程序 ， 不 过 把 自动 机 转化 为 正则 表达 式 
的 构造 过 程 也 是 很 有 趣 很 有 益 的 , 它 完 成 了 这 两 种 截然 不 同 的 模式 表示 法 的 表现 力 之 间 的 等 价 
性 的 证 明 。 

我 们 的 构造 过 程 涉及 从 自动 机 中 一 个 一 个 地 删除 状态 。 随 着 构造 过 程 的 进行 ， 会 把 弧 上 的 
标号 由 最 初 的 字符 串 集 合 蔡 换 为 更 复杂 的 正则 表达 式 。 一 开始 , 如 果 弧 上 的 标号 是 { x ， x, ，… 
x, }， 就 可 以 把 这 些 标号 替换 为 正则 表达 式 x x,l…| x,, ， 该 正则 表达 式 从 本 质 上 讲 表示 的 是 相 
同 的 符号 集合 ,虽然 严格 地 讲 正 则 表达 式 表示 的 是 长 度 为 1 的 字符 串 。 

一 般 而 言 ， 可 以 将 路 径 的 标号 视 为 路 径 沿 线 上 正则 表达 式 的 串 接 ,或 是 看 作 这 些 表达 式 的 
串 接 定 义 的 语言 。 这 一 观点 与 我 们 用 字符 串 标 记 路 径 的 概念 是 一 致 的 。 也 就 是 说， 如 果 路 径 的 
弧 是 用 正则 表达 式 RR 、R, 、…、 忆 按 此 次 序 标记 的 ， 则 当 且 仅 当 字符 串 w 在 语言 Z(R R… RR,) 
中 时 有 该 路 径 被 标记 为 w。 


+ 示例 10.29 

考虑 图 10-38 中 的 路 径 0 一 1 一 2 。 正 则 表达 式 alb 和 alblc 依 次 标记 了 这 两 条 弧 ， 因 此 标 
记 该 路 径 的 字符 串 集 合 是 由 正则 表达 式 (a | b)(a 1 b 1 c) 定 义 的 语言 中 的 字符 串 构 成 的 , 也 就 是 
{aa, ab, ac, ba, bb, bcl}。 

















图 10-38 ”以 正则 表达 式 作为 标号 的 路 径 ， 路 径 的 标号 是 由 正则 表达 式 
的 串 接 定义 的 语言 
10.9.1 状态 消除 的 构造 


在 从 自动 机 到 正则 表达 式 的 转化 中 , 关键 的 步 又 就 是 状态 的 消除 ， 如 图 10-39 所 示 。 我 们 乔 
望 消除 状态 u, 不 过 必须 保留 弧 的 正则 表达 式 标号 , 从 而 使 剩余 状态 中 两 两 之 间 路 径 的 标号 集合 
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不 发 生 改 变 。 在 图 10-39 中 , 状态 uw 的 前 导 分 别 是 s,、s，,、…、s,， 而 wu 的 后 继 则 分 别 是 1 、t,、… 
1,。 时 然 已 经 证 明了 这 些 s 和 1 是 不 相交 的 状态 集 , 但 其 实 两 组 中 还 是 可 能 存在 一 些 相同 的 状态 。 











图 10-39 ”我 们 想 消 除 状 态 u 





不 过 ， 如 果 u 是 它 本 身 的 后 继 ,我 们 就 要 用 标记 为 U0 的 弧 明 确 表 示 这 一 事实 。 假 设 在 状态 u 
处 没有 这 样 的 自 环 ,那么 可 以 引入 一 个 这 样 的 自 环 ,并 赋予 其 标号 名 。 标 号 为 名 的 弧 是 “不 存 
在 的 "， 因 为 任意 用 到 这 条 弧 的 路 径 标号 都 会 是 含有 人 的 正则 表达 式 的 串 接 。 因 为 儿 是 串 接 的 
零 元 ， 所 以 这 样 的 串 接 定义 的 都 是 空 语 言 。 

我 们 还 要 明确 给 出 从 ;到 妃 的 弧 尽 。 一 般 而 言 ， 假 设 对 每 个 ;=1、2、…、7m， 以 及 对 每 个 
j=1、2、…、m， 都 存在 从 s, 到 1 的 弧 ， 由 某 个 正则 表达 式 R; 标记 。 如 果 弧 s, 一 妃 实 际 上 不 存 
在 ， 就 引入 它 并 为 其 赋予 标号 2。 

最 后 , 在 图 10-39 中 存在 从 各 状态 * 到 uw 的 ， 由 正则 表达 式 s, 标记 的 弧 , 而 且 存 在 从 u 到 各 状 
态 t 的 , 由 正则 表达 式 也 标记 的 弧 。 如 果 消 除 节 点 zx, 那么 这 些 弧 与 图 10-39 中 标记 为 U0 的 弧 痢 将 
不 复 存在 。 要 让 标记 路 径 的 字符 串 集 合 保持 不 变 ， 就 必须 考虑 每 对 s, 和 1t, ， 并 为 弧 s, 一 坊 的 标 
号 添加 一 个 能 表示 所 失去 内 容 的 正则 表达 式 。 

在 消除 u 之 前 , 标记 了 从 s, 到 u (包括 多 次 行经 的 那些 zx 一 # 自 环 ) 然后 从 u 到 的 路 径 的 那 
些 字符 串 集合 是 由 正则 表达 式 SUw*7 描述 的 。 也 就 是 说 , Z(S ) 中 的 字符 串 可 以 把 我 们 从 状态 8 
带 到 到 状态 u, LCU*) 中 的 字符 捉 可 以 把 我 们 从 状态 w 带 到 状态 u, 沿 着 该 自 环 0 次 、1 次 或 更 多 次 。 
最 后 ,ZL(7) 中 的 字符 串 把 我 们 从 状态 u 带 到 状态 1 。 

因此 ,在 消除 状态 wu 和 所 有 进出 的 弧 之 后 ,必须 把 弧 s, 1 的 标号 由 RR; 替换 为 Rj|S,U*T。 

存在 不 少 实用 的 特例 。 首 先 ， 车 U== 儿 ， 即 x 上 的 自 环 并 非 真正 存在 ， 那么 U*=@B*=e 。 
为 e 是 串 接 的 单位 元 ， 所 以 (S,e)7, = 5,7, ， 也 就 是 说 ，U 其 实在 它 应 该 出 现 的 位 置 消失 了 。 同 样 ， 
如 果 R, = 名 ， 意 味 着 之 前 没有 从 s; 到 zt 的 弧 ， 我 们 就 引入 这 条 弧 ， 并 给 予 其 标号 S,iU*7, ,或 者 
如 果 U = 名 , 就 是 5,7,。 这样 做 的 原因 在 于 ， 儿 是 取 并 运算 的 单位 元 , 因此 |SU*7T, =S,U*7,。 














+ 示例 10.30 

我 们 来 考虑 一 下 图 10-4 所 示 的 反弹 过 滤器 自动 机 ,这 里 的 图 10-40 重 现 了 该 自动 机 。 假 设 要 消 
除 状 态 b»， 它 们 就 扮演 了 图 10-39 中 ww 的 角色 。 状 态 b 有 一 个 前 导 a， 以 及 两 个 后 继 aq 和 c。b 上 不 存在 
自 环 ， 所 以 要 引入 一 个 标号 为 名 的 自 环 。 存在 从 a 到 其 本 身 , 标记 为 0 的 弧 。 因 为 a 既是 5b 的 前 导 又 
是 bp 的 后 继 ， 所 以 该 弧 在 这 一 变形 中 是 必须 的 。 唯 一 一 对 男 外 的 前 导 - 后 继 对 是 a 和 c。 因 为 不 存在 
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弧 a 一 c ， 所 以 可 以 添加 一 条 标号 为 名 的 弧 a 一 c 。 相 关 状 态 和 弧 组 成 的 图 如 图 10-41 所 示 。 





图 10-40 与 反弹 过 滤 需 对 应 的 有 限 自 动机 


0 





图 10-41 ”状态 5»， 以 及 它 的 前 导 和 后 继 





对 状态 对 a-a 而 言 ， 我 们 把 浙 a 一 a 的 标号 蔡 换 为 0|1B*0 。0 这 项 表示 该 弧 的 原始 标号 ， 
而 1 这 项 是 a 一 5 的 标号 ， 名 是 自 环 b 一 b 的 标号 ， 而 第 二 个 0 项 则 是 弧 b 一 a 的 标号 。 我 们 可 
以 按照 之 前 的 描述 进行 简化 ， 消 除名 *， 留 下 表达 式 0110， 这 是 说 得 通 的 。 在 图 10-40 中 ， 从 a 
到 a 的 路 径 ， 行 经 bp 状态 0 次 或 多 次 ， 而 不 经 过 其 他 状态 ， 其 标号 集合 为 {0，10}。 

处 理 状态 对 a-c 的 过 程 是 类 似 的 。 我 们 要 用 可 以 简化 为 11 的 名 |1g*1 替 代 弧 a 一 c 的 标号 
名 。 这 还 是 说 得 通 的 ， 因 为 在 图 10-40 中 ， 从 a 到 c 的 唯一 路 径 ， 经 过 bp 而 且 标 号 为 11。 在 消除 节 
点 b 并 改变 弧 标 号 后 ， 图 10-40 就 成 了 图 10-42。 请 注意 ， 在 该 自动 机 中 ， 某 些 弧 标号 中 的 正则 表 
达 式 具有 长 度 大 于 1 的 字符 串 。 不 过 ,状态 a、c 和 4d 之 间 的 路 径 对 应 的 路 径 标 号 集合 与 图 10-40 相 


比 没有 发 生 改变 。 
1 
起 始 @) Cy) 


0|10 1 
图 10-42 ”消除 了 状态 bp 之 后 的 反弹 过 滤器 目 动机 
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10.9.2 自动 机 的 完全 简化 


要 得 到 只 表示 所 有 由 上 自动 机 4 接受 的 字符 串 的 正则 表达 式 ， 就 要 依次 考虑 4 的 各 接受 状态 六 
每 个 被 4 接受 的 字符 串 之 所 以 会 被 接受 ， 是 因为 它 标 记 了 从 起 始 状 态 s 到 茶 个 接受 状态 上 的 路 径 。 
可 以 按照 以 下 方式 ,为 那些 把 我 们 从 s 带 到 某 个 特定 接受 状态 的 字符 串 构 造 相应 的 正则 表达 式 。 

反复 消除 自动 机 4 的 状态 ， 直 到 只 剩 * 和 1 两 个 状态 ， 这 样 一 来 ， 该 自动 机 就 如 图 10-43 这 样 
了 。 我 们 已 经 展示 了 所 有 4 条 可 能 的 弧 , 每 一 条 都 以 一 个 正则 表达 式 作 为 其 标号 。 如 有 果 一 条 或 多 
条 可 能 的 弧 不 存在 ， 可 以 引入 该 弧 并 为 其 标记 上 多 。 








S 全 
V 
起 始 有 一 
U 


图 10-43 ”减少 到 两 个 状态 的 自动 机 


需要 找 出 有 哪些 正则 表达 式 描 述 了 始 于 s 并 终于 t 的 路 径 的 标号 集合 。 表 示 该 字符 串 集 合 的 
一 种 方式 是 认识 到 每 一 条 这 样 的 路 径 会 先 到 达 t， 然 后 从 { 行 至 其 自身 0 次 或 多 次 ， 还 可 能 在 行进 
的 过 程 中 经 过 s。 一 开始 把 我 们 带 到 状态 t 的 字符 串 集合 是 L(S*U)。 也 就 是 说 ,要 用 到 L(5) 中 的 字 
符 串 0 次 或 多 次 ， 这 样 做 就 会 先 留 在 状态 s 中 ， 然 后 沿 着 L( 吕 中 的 字符 串 行进 。 我 们 既 可 以 跟随 
ZL() 中 的 字符 串 停 留 在 状态 中 ， 这 会 将 我 们 从 it 带 到 1， 也 可 以 沿 着 VS*U 中 的 字符 串 到 达 s， 在 s 
停顿 一 会 儿 ， 然 后 又 回 到 # 我 们 可 以 沿 着 这 两 组 中 以 任意 次 序 排列 的 0 个 或 多 个 字符 串 行 进 ， 
并 将 其 表示 为 (TIVS*U*。 因 此 从 状态 s 到 状态 1 的 字符 串 集 合 对 应 的 正则 表达 式 就 是 

S*U(TIVS*U)* (10.4) 

存在 一 种 特例 ， 就 是 起 始 状 态 s 本 身 也 是 接受 状态 的 情况 。 这 样 的 话 ， 有 些 字符 串 被 接受 的 原因 
是 因为 它们 将 自动 机 4 从 状态 s 带 到 了 状态 *。 我 们 消除 了 除 s 之 外 的 所 有 状态 ， 留 下 如 图 10-44 所 
示 的 自动 机 。 将 4 从 状态 s 囊 到 状态 s 的 字符 串 集合 是 L(S*)。 因 此 可 以 用 S* 作 为 取代 接受 状态 s 的 
贡献 的 正则 表达 式 。 








起 始 


图 10-44 ”只 有 起 始 状 态 的 自动 机 


将 起 始 状 态 为 s 的 自动 机 4 转化 成 等 价 正则 表达 式 的 完整 算法 如 下 所 述 。 对 每 个 接受 状态 1 
而 言 ， 从 自动 机 4 开始 ， 并 消除 各 种 状态 ， 直 到 只 剩 下 状态 s 和 t。 当 然 ， 对 每 个 接受 状态 来 说 ， 
都 要 从 全 新 的 原 自 动机 4 开始 进行 处 理 。 

如 果 s zt ,就 使 用 (10.4) 式 得 出 其 语言 是 把 4 从 状态 s 带 到 状态 1 的 字符 串 集 合 的 正则 表达 式 。 
如 有 果 s=t，, 就 利用 S*, 其 中 5 是 弧 s 一 s 的 标号 。 然后 , 为 对 应 每 个 接受 状态 1 的 正则 表达 式 取 并 。 
该 表达 式 的 语言 就 刚好 是 被 4 接受 的 字符 串 的 集合 。 
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+ 示例 10.31 

下 面 来 为 图 10-40 所 示 的 反弹 过 滤器 自动 机 得 出 相应 的 正则 表达 式 。 因 为 c 和 cd 是 接受 状态 ， 
所 以 需要 进行 下 列 操作 : 

(1) 从 图 10-40 中 消除 状态 5 和 4d， 得 到 只 涉及 a 和 c 的 自动 机 ; 

(2) 从 图 10-40 中 消除 状态 5 和 c， 得 到 只 涉及 a 和 qd 的 自动 机 。 

因为 在 这 两 种 情况 下 都 必须 消除 状态 上， 所 以 图 10-42 就 让 我 们 的 最 终 目标 实现 了 一 半 。 对 
情况 (1)， 要 在 图 10-42 的 基础 上 消除 状态 4。 存 在 从 c 经 过 d 到 a 的 标号 为 00 的 路 径 ， 所 以 需要 引 
人 一 条 从 c 到 a 标记 为 00 的 弧 。 存 在 从 c 经 过 4 回 到 其 自身 的 标号 为 01 的 路 径 ， 因 此 需要 为 c 人 处 的 
自 环 添 加 标号 01， 这 样 该 标号 就 成 了 1101。 得 到 的 自动 机 如 图 10-45 所 示 。 


wh 








0 | 10 1|01 
图 10-45 ”把 图 10-40 所 示 的 自动 机 减少 到 只 剩 状态 a 和 状态 c 
对 目标 (2)， 要 再 次 从 图 10-42 开 始 ， 而 这 次 要 消除 状态 c。 在 图 10-42 中 ， 我 们 可 以 从 a 经 过 c 
到 达 4， 而 描述 可 能 字符 串 的 正则 表达 式 为 111*0。" 也 就 是 说 ，11 将 我 们 从 a 带 到 c，1* 让 我 们 
在 c 处 循环 0 次 或 多 次 , 而 最 后 0 把 我 们 从 c 带 到 d。 因此 , 我 们 引入 了 从 a 到 4 的 标号 为 111*0 的 弧 。 
同样 ,在 图 10-42 中 ,可 以 沿 着 11*0 中 的 字符 串 ， 从 4 通过 c 行 至 其 自身 。 因 此 ,， 这 一 表达 式 成 了 
d 处 自 环 的 标号 。 简 化 过 的 自动 机 如 图 10-46 所 示 。 


起 CE 











0 | 10 11*0 
图 10-46 ”把 图 10-40 中 的 自动 机 减少 到 只 剩 状 态 <c 和 状态 4 
现在 可 以 把 (10.4) 中 得 出 的 公式 应 用 到 图 10-45 和 图 10-46 所 示 的 自动 机 上 。 对 图 10-45， 有 


S=0|10,，U=11, =00 ， 而且 7=1|01。 因 此 表示 将 图 10-40 所 示 的 自动 机 从 起 始 状 态 a 带 
到 接受 状态 c 的 字符 串 集 合 的 正则 表达 式 为 





(OL TLIO TO (OTL) (10.5) 
而 表示 把 该 自动 机 从 起 始 状 态 a 带 到 接受 状态 4 的 字符 串 的 正则 表达 式 为 
(0|10)*111*0(11*0|0 (0|10)*111*0)* (10.6) 








QD 请 记 住 ， 因 为 * 的 优先 级 高 于 串 接 ，111*0 会 被 解释 为 11(1*)0， 并 表示 由 两 个 或 更 多 1 后 面 加 以 一 个 0 构成 的 字 
符 串 。 
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表示 由 反弹 过 滤 需 自动 机 接受 的 字符 串 的 正则 表达 式 就 是 对 (10.3) 和 (10.6) 取 并 ， 或 者 说 是 
((0|110)*x11((1L101) 100(0110)x11)x*) | ((0|10)*111*0(11*0|0(0|10)*111*0)*) 
没有 办 法 对 该 表达 式 进 行 多 少 简化 ， 因 为 相同 的 因 式 只 有 (0 1 10)*11， 其 他 就 基本 没有 什么 相 
同 的 了 。 我 们 可 以 删除 (10.5) 中 因 式 (1 1 01) 周 围 的 括号 ， 因 为 取 并 运算 是 具有 结合 性 的 ， 这 样 

得 到 的 表达 式 就 是 
(0|10)*11((1|01|00(0|10)*11)*) | 1*0(11*0 |0(0|10)*111*0)*) 
大 家 可 以 回想 一 下 ， 我 们 为 同样 的 语言 提出 过 一 个 简单 得 多 的 正则 表达 式 
(0 | 1)*11(1 | 01)*(e | 0) 
这 一 区 别 应 该 提醒 我 们 ， 对 同一 语言 来 说 ， 可 能 存在 不 止 一 个 与 之 对 应 的 正则 表达 式 ， 而 通过 
转化 自动 机 得 到 的 正则 表达 式 也 不 一 定 是 对 应 该 语言 的 最 简 表 达 式 。 


10.9.3 ”习题 


(1) 分 别 找 出 下 列 各 图 所 示 自 动机 对 应 的 正则 表达 式 。 
(a) 图 10-3 
(b) 图 10-9 
(c) 图 10-10 
(d) 图 10-12 
(e) 图 10-13 
(f) 图 10-17 
(g) 图 10-20 
大 家 可 能 会 希望 利用 10.6 节 中 的 简略 形式 。 
(2) 把 10.4 市 习题 (1) 中 的 自动 机 转化 成 正则 表达 式 。 
(3) * 证 明 ， 把 我 们 从 图 10-43 中 的 状态 * 带 到 状态 1 的 字符 串 集合 对 应 的 另 一 个 正则 表达 式 是 
(SIUT*V)*UT*, 
(4) 如 何 修改 本 节 中 的 构造 过 程 ， 使 得 正则 表达 式 可 以 由 具有 e 转换 的 自动 机 生成 ? 






































10.10 小结 








10.4 节 的 子 集 构造 ， 以 及 10.8 节 和 10.9 节 中 的 转化 ， 告 诉 我 们 3 种 表示 语言 的 方式 有 着 相同 
的 表现 效用 。 也 就 是 说 ， 针 对 某 语言 Z 的 以 下 3 个 命题 要 么 都 为 真 ， 要 么 都 为 假 。 

(1) 存在 某 确定 自动 机 只 接受 L 中 的 所 有 字符 串 。 

(2) 存在 某 ( 可 能 为 非 确定 的 ) 自动 机 只 接受 L 中 的 所 有 字符 串 。 

(3) ZL 对 某 正 则 表达 式 R 来 说 是 L(R)。 

子 集 构造 说 明了 (2) 可 以 得 到 (1)。 显 然 有 (1) 就 有 (2)， 因 为 确定 自动 机 就 是 一 种 特殊 形式 的 
非 确定 自动 机 。 我 们 在 10.8 节 中 证 明了 由 (3) 可 以 得 到 (2)， 而 在 10.9 节 中 证 实 了 有 (2) 就 有 (3)。 
此 ，(1)、(2) 和 (3) 是 等 价 的 。 

除了 这 些 等 价 关系 外 ， 我 们 还 应 该 从 第 10 章 获得 一 些 重 要 思路 。 

口 确定 自动 机 可 作为 识别 字符 串 多 种 不 同 模式 的 程序 的 核心 。 

口 正则 表达 式 通常 是 一 种 用 于 描述 模式 的 便利 表示 方法 。 

口 正则 表达 式 的 代数 法 则 使 得 取 并 和 串 接 与 加 法 和 乘法 有 着 类 似 的 性 质 ， 不 过 还 是 存在 一 


些 区 别 。 
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在 第 10 章 中 , 我 们 看 到 过 两 种 等 价 的 模式 描述 方式 。 一 种 是 图 论 方式 , 利用 了 一 种 名 为 “ 自 
动机 ”的 图 中 路 径 的 标号 。 男 一 种 是 代数 方式 ， 利 用 了 正则 表达 式 。 在 本 草 中 ， 我 们 将 看 到 第 
三 种 描述 模式 的 方式 , 利用 到 了 一 种 名 为 “上 下 文 无 关 文 法 ”( 以 下 简称 “文法 ”) 的 递归 定义 。 

文法 的 重要 应 用 之 一 就 是 作为 编程 语言 的 规范 。 文 法 是 用 来 描述 常见 编程 语言 句法 的 一 种 
简洁 表示 方式 ， 我 们 会 在 本 章 中 看 到 很 多 示例 。 此 外 ， 有 一 种 机 械 的 方式 可 以 把 常见 编程 语言 
的 文法 转换 成 “分 析 右 ”( parser ) 该 声言 编译 需 的 一 个 关键 部 分 。 分 析 程 序 揭示 了 源 程 序 
的 结构 ， 通 常 是 将 程序 中 的 每 条 语句 表示 为 表达 式 树 的 形式 。 


11.1 ”本章 主 要 内 容 


本 章 主 要 讨论 如 下 主题 。 

口 文法 以 及 文法 是 如 何 用 来 定义 语言 的 (11.2 节 和 11.3 市 )。 

口 分 析 树 ,根据 给 定 文法 显示 字符 串 结构 的 树 表示 (11.4 节 )。 

口 歧义 ， 当 某 一 字符 串 有 两 棵 或 更 多 分 析 树 ， 并 因此 根据 给 定 文法 不 具有 唯一 “结构 ”时 
出 现 的 问题 (11.5 市 )。 

口 把 文法 转换 成 “分 析 器 ”的 一 种 方法 ,“ 分 析 需 ”是 可 以 分 辩 给 定 字 符 串 是 否 在 某 一 语言 
中 的 算法 (11.6 节 和 11.7 节 )。 

口 证 明文 法 在 描述 语言 方面 要 比 正则 表达 式 更 强大 ( 11.8 方 )。 首先, 我 们 通过 证 明 如 何 用 
文法 模拟 正则 表达 式 ， 来 证 明文 法 的 描述 性 至 少 与 正则 表达 式 一 样 强 。 接 着 我 们 将 描述 
一 种 只 能 用 文法 来 指定 而 不 能 用 正则 表达 式 指定 的 特殊 语言 。 


























11.2” 上下文 无 关 文 法 


算术 表达 式 可 以 由 递归 定义 自然 而 然 地 定义 出 来 。 下 面 的 示例 说 明了 这 一 定义 是 如 何 起 效 
的 。 我 们 来 考虑 涉及 如 下 内 容 的 算术 表达 式 。 

(1) 4 种 二 元 运算 符 +、 一 、* 和 /; 

(2) 用 于 分 组 的 圆 括号 ; 

(3) 作为 操作 数 的 数字 。 

这 种 表达 式 的 一 般 定义 是 具有 如 下 形式 的 归纳 。 
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依据 。 一 个 数字 是 一 个 表达 式 。 

归纳 。 如 果 E 是 表达 式 ， 那 么 以 下 各 种 也 都 是 表达 式 。 

(a) (2)。 也 就 是 说 ， 我 们 可 以 在 表达 式 周 围 放 上 辆 括号 以 得 到 新 表达 式 。 

(b) EtE。 也 就 是 说 ， 用 加 号 连接 的 两 个 表达 式 是 一 个 新 表达 式 。 

(c) E-B。 这 一 条 以 及 接 下 来 的 两 条 规则 都 与 (0) 类 似 ， 不 过 使 用 了 其 他 的 运算 符 。 

(d)E*E, 

(e) E/E。 

这 一 归纳 定义 了 一 种 语言 ， 也 就 是 一 个 字符 串 集 合 。 依 据 陈述 了 任意 数字 都 在 该 语言 中 。 
规则 (a) 表 示 ， 如 有 果 s 是 该 语言 中 的 字符 串 ， 那么 加 过 括号 的 字符 串 (9) 也 在 该 语言 中 , 这 一 字符 串 
是 sz 前 面 加 上 左 括号 并 且 后 面 跟 上 右 括号 得 到 的 。 规则 (b) 到 规则 (e) 是 说 ， 如 果 s 和 t 是 该 语言 中 的 
两 个 字符 串 ， 那 么 stt、s-t、s * tflls/t 也 都 是 该 语言 中 的 字符 串 。 

文法 让 我 们 可 以 写 出 这 些 简 明 而 且 含 义 精确 的 规则 。 举 例 来 说 ， 可 以 用 图 11-1 所 示 的 文法 
写 出 我 们 对 算术 表达 式 的 定义 。 

(1) < 表达 式 > 一 数字 

(2) < 表达 式 > 一 (< 表达 式 >) 

(3) < 表达 式 > 一 < 表达 式 >+< 表 达 式 > 
(4) < 表达 式 > 一 < 表达 式 > 一 < 表达 式 > 
(5) < 表达 式 > 一 < 表达 式 >*< 表 达 式 > 
(6) < 表达 式 > 一 < 表达 式 >/< 表 达 式 > 


























图 11-1 对 应 简单 算术 表达 式 的 文法 
这 里 要 对 图 11-1 中 用 到 的 符号 作出 一 些 解释 ， 符 号 


< 表达 式 > 

称 为 语法 分 类 ( syntactic category )， 它 代表 这 一 算术 表达 式 语 言 中 的 任意 字符 串 。 符 号 一 
的 含义 是 “可 由 …… 组 成 ”。 例 如 , 图 11-1 中 的 规则 (2) 就 表示 ， 表 达 式 可 由 左 括号 后 跟 上 属于 表 
达 式 的 任意 字符 串 再 跟 上 右 括 号 组 成 。 规 则 (3) 表 明 ， 表 达 式 可 由 属于 表达 式 的 任意 字符 串 、 字 
符 +， 以 及 属于 表达 式 的 任意 其 他 字符 串 组 成 。 规 则 (4) 到 规则 (6) 与 规则 (3) 是 相似 的 。 

规则 () 则 不 同 ， 因 为 箭头 右 侧 的 符号 数字 从 字面 上 看 本 不 是 字符 串 ， 它 只 是 与 可 以 解释 为 
数字 的 字符 串 相对 应 的 占 位 符 。 我 们 在 后 面 的 内 容 中 会 介绍 如 何 用 文法 定义 数字 ， 但 现在 先 只 
把 数字 当 作 一 个 抽象 符号 ， 而 表达 式 用 该 符号 来 表示 任意 原子 操作 数 。 
11.2.1 与 文法 相关 的 术语 

文法 中 会 出 现 3 种 符号 。 第 一 种 是 “元 符号 ”， 是 那些 扮演 特殊 角色 而 并 不 代表 它们 自 映 的 
符号 。 我 们 目前 为 止 已 经 见 过 的 元 符号 只 有 一， 它 的 用 途 是 把 要 定义 的 语法 分 类 与 该 语法 分 类 
中 字符 串 可 能 的 组 成 方式 分 隔 开 。 第 二 种 符号 是 语法 分 类 ， 我 们 说 过 ， 这 种 符号 表示 的 是 要 定 
义 的 字符 串 集合 。 第 三 类 符号 称 为 终结 符 (terminal )。 终 结 符 可 以 是 + 或 〈 这 样 的 字符 ， 也 可 以 
是 数字 这 样 的 抽象 符号 ， 它 代表 我 们 和 希望 在 随后 定义 的 字符 串 。 

文法 是 由 产生 式 (production ) 组 成 的 。 图 11-1 中 的 每 一 行 都 是 一 个 产生 式 。 一 般 而 言 ， 产 
生 式 具 有 以 下 3 个 部 分 。 

(1) 左 部 ( head )， 就 是 箭头 符号 左 侧 的 语法 分 类 。 


= 


(2) 元件 守 一 。 
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(3) 右 部 (body )， 由 箭头 右 侧 0 个 或 以 上 的 语法 分 类 和 【或 ) 终结 符 组 成 。 
例如 ， 在 图 11-1 的 规则 (2) 中 ， 左 部 是 < 表达 式 >， 而 右 部 则 由 终结 符 ( 、 语 法 分 类 < 表达 式 > 
和 终结 符 ) 组 成 。 


+ 示例 11.1 
我 们 可 以 通过 为 数字 提供 定义 来 扩展 本 节 开 始 时 对 表达 式 的 定义 。 这 里 要 假设 数字 是 由 数 
人 码 (digit ) 组 成 的 字符 串 。 借 用 10.6 节 中 扩展 过 的 正则 表达 式 表示 法 ， 可 以 说 


digit = [0-9] 


number = digif 

不 过 也 可 以 用 文法 表示 法 来 表示 同样 的 概念 ,我 们 可 以 写 出 以 下 产生 式 
< 数码 > 一 0111213141516171819 
< 数字 > 一 < 数码 > 





< 数字 > 一 < 数字 > < 数码 > 
请 注意 ， 根 据 我 们 对 元 符号 | 的 约定 ， 第 一 行 其 实 是 以 下 10 个 产生 式 的 简化 形式 。 
< 数码 > 一 0 








< 数码 > 一 1 


< 数码 > 一 9 

可 以 用 同样 的 方法 把 对 应 < 数字 > 的 两 个 产生 式 合并 成 一 行 。 请 注意 ,对 应 < 数字 > 的 第 一 个 
产生 式 表 示 单 个 数码 是 个 数字 ， 而 第 二 个 产生 式 的 意思 是 ， 任 何 数字 后 跟 上 另 一 个 数码 也 是 数 
字 。 这 两 个 表达 式 一 起 就 表示 任何 由 数码 组 成 的 串 都 是 数字 。 

图 11-2 是 扩展 过 的 表示 表达 式 的 文法 ， 其 中 抽象 的 终结 符 数 字 被 替换 为 定义 了 该 概念 的 产 
生 式 。 请 注意 ,该 文法 含有 3 个 语法 分 类 < 表达 式 >、< 数 字 > 和 < 数码 >。 我 们 会 把 语法 分 类 < 表达 
式 > 当 作 起 始 符号 ( start symbol )， 它 生成 了 要 用 该 文法 定义 的 串 ， 在 这 种 情况 中 ， 就 是 格式 标 
准 的 算术 表达 式 。 其 他 两 个 语法 分 类 < 数字 > 和 < 数码 > 代表 的 补充 概念 是 很 关键 的 , 但 不 是 写 出 
该 文法 所 需 的 主要 概念 。 























表示 方式 的 约定 

在 表示 语法 分 类 时 , 我 们 是 在 其 斜体 名 称 ( 中 文 为 楷体 ) 的 两 侧 加 上 尖 括 号 表示 的 , 例如 ， 
< 表达 式 >。 产 生 式 中 的 终结 符 或 者 用 代表 字符 囊 x 的 粗 体 x 来 表示 ( 类 似 正则 表达 式 的 约定 )， 
或 者 在 终结 符 为 抽象 符号 的 情况 下 (比如 之 前 例子 中 的 数字 )， 用 不 带 尖 括号 斜体 字符 串 〈 中 
文 为 楷体 ) 表示 。 

元 符号 e 表示 空 右 部 。 因 此 产生 式 <S> 一 e 意味 着 语法 分 类 <S> 的 语言 中 包含 了 空 字符 囊 。 
我 们 有 时 会 将 某 一 语法 分 类 的 右 部 合并 到 一 个 产生 式 中 ， 分别 用 可 以 称 作 “或 ”的 元 符号 | 隔 
开 。 例 如 ， 如 果 有 以 下 产生 式 

<S> 一 有 ，<S> 一 有 ，…，<S> 一 有 


其 中 这 些 B 分 别 是 对 应 语法 分 类 <S> 的 各 产生 式 的 右 部 ， 那 么 可 以 将 这 些 产 生 式 写 为 
<S>B | 及 1 
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(1) < 数码 > 一 0|1|2|314|5|6|7|819 


(2) < 数字 > 一 < 数码 > 

(3) < 数字 > 一 < 数字 > 一 < 数码 > 

(4) < 表达 式 > 一 < 数字 > 

(5) < 表达 式 > 一 (< 表达 式 >) 

(6) < 表达 式 > 一 < 表达 式 > + < 表达 式 > 
(7) < 表达 式 > 一 < 表达 式 > 一 < 表达 式 > 
(8) < 表达 式 > 一 < 表达 式 > * < 表达 式 > 
(9) < 表达 式 > 一 < 表达 式 > / < 表达 式 > 


图 11-2 与 由 用 文法 定义 的 数字 组 成 的 表达 式 对 应 的 文法 








+ 示例 11.2 

2.6 方 中 曾 讨论 过 平衡 圆 括号 串 的 概念 hE a ee 
纳 定 义 ， 而 正式 形式 的 书写 文法 正 是 本 节 要 介绍 的 。 我 们 定义 了 “平衡 圆 括号 串 ” 的 话 法 分 类 ， 
这 里 称 其 为 < 平衡 的 >。 依 据 规 则 陈述 了 空 串 是 平衡 的 。 is 

< 平衡 的 > 一 e 
然后 就 是 归纳 步骤 ,说 的 是 如 果 x* 和 ) 都 是 平衡 圆 括号 串 , 那么 (wy 也 是 。 可 以 把 这 一 规则 写 为 产 
生 式 

-平衡 的 > 一 ( < 平衡 的 > ) < 平衡 的 > 
因此 ， 图 11-3 中 的 文法 可 以 说 是 定义 了 平衡 圆 括 号 串 。 











< 平衡 的 >> 一 上 
< 平衡 的 > 一 (< 平衡 的 >>) < 平衡 的 > 





图 11-3 ”对 应 平衡 圆 括号 串 的 文法 
还 有 男 一 种 定义 平衡 括号 串 的 方式 。 回 想 一 下 2.6 节 ,我们 描述 这 种 串 的 原始 动机 就 是 ， 它 
们 是 删除 了 表达 式 中 除 括号 外 所 有 内 容 后 留 下 的 括号 的 子 序列 。 图 11-1 给 出 了 对 应 表达 式 的 文 
法 。 考 虑 一 下 ， 如 果 删 除 抒 除 括号 之 外 的 所 有 终结 符 ， 会 发 生 什么 。 此 时 产生 式 (D 就 成 了 
< 表达 式 > 一 e 
产生 式 (2) 变 成 了 
< 表达 式 > 一 (< 表达 式 > ) 
而 产生 式 (3) 到 产生 式 (6) 都 成 了 
< 表达 式 > 一 < 表达 式 > < 表达 式 > 
如 果 用 更 为 合适 的 名 称 < 平 衡 表达 式 > 来 代 蔡 < 表达 式 >， 就 得 到 男 一 种 表示 平衡 圆 括 号 串 的 文 
法 ， 如 图 11-4 所 示 。 这 些 产生 式 都 是 相当 自然 的 。 它 们 表明 了 如 下 3 点 。 
(1) 空 串 是 平衡 的 ; 
(2) 如 果 为 平衡 的 串 加 上 圆 括号 ， 得 到 的 串 也 是 平衡 的 ; 
(3) 而 且 平 衡 串 的 串 接 是 平衡 的 。 
< 平衡 表达 式 > 一 € 
< 平衡 表达 式 > 一 (< 平衡 表达 式 >) 
< 平衡 表达 式 > - (< 平衡 表达 式 >) < 平衡 表达 式 > 
图 11-4 ”由 算术 表达 式 文法 发 展 来 的 表示 平衡 圆 括号 串 的 文法 
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图 11-3 和 图 11-4 中 的 文法 看 起 来 相当 不 同 ， 不 过 它们 定义 了 相同 的 字符 串 集合 。 证 明 它 们 
确实 定义 了 同一 字符 串 集 合 最 简单 的 方式 也 许 就 是 证 明 由 图 11-4 中 < 平衡 表达 式 > 定 义 的 圆 括 号 
串 刚 好 就 是 2.6 节 中 定义 的 “量变 平衡 ” 圆 括号 串 。 好 了 ， 现 在 证 明了 与 图 11-3 中 < 平衡 的 > 定义 
的 圆 括 号 串 有 关 的 相同 断言 。 





共用 文法 模式 


示例 11.1 用 了 两 个 对 应 < 数字 > 的 产生 式 来 说 明 “ 数 字 是 由 数码 组 成 的 串 ”。 这 种 模式 就 是 
共用 的 。 一 般 而 言 ， 如 果 有 语法 分 类 < 了 EE， 而 且 Y 是 终结 符 或 是 另 一 个 语法 分 类 ， 产 生 式 


<X>— <X>7Y|Y 
说 明 任意 由 7 组 成 的 事 都 是 <X>。 如 果 用 正则 表达 式 来 表示 ， 就 是 <X> = 六。 同样 ， 产 生 式 
<X>— <X>Ye 
就 表示 每 个 由 0 个 或 更 多 的 7 组 成 的 囊 都 是 <X>， 或 者 说 <X> = 六。 由 
<X>— <X> ZYY 


这 样 一 对 产生 式 表 示 的 也 是 种 共用 模式 ， 表 示 每 个 开头 和 结尾 都 是 而 且 由 7Y 和 2 交替 组 成 的 囊 
都 是 < 全 。 也 就 是 说 ，< 人 = Y(Z7D)”。 
此 外 ， 我 们 可 以 反 转 上 述 3 个 例子 任意 一 个 中 递归 产生 式 右 部 中 符号 的 次 序 ， 例 如 
< — Y<X>|Y 
也 定义 了 < 了 = 了 。 





+ 示例 11.3 

还 可 以 用 文法 的 方式 来 描述 C 语 言 这 样 的 编程 语言 中 控制 流 的 结构 。 举 个 简单 的 例子 ， 想 
象 条 件 和 简单 语句 这 两 个 抽象 终结 符 。 前 者 代表 条 件 表达 式 。 我 们 可 以 把 这 一 终结 符 蔡 换 为 语 
法 分 类 , 假如 说 是 < 条 件 >。< 条 件 > 的 产生 式 可 以 用 之 前 所 述 的 表达 式 文法 来 构建 ,但 是 用 到 的 
运算 符 包 含 了 &g 这 样 的 逻辑 运算 符 、< 这 样 的 比较 运算 符 ， 以 及 算术 运算 符 。 

终结 和 从 简单 语句 代表 不 含 召 套 控制 结构 的 语句 ， 比 如 赋值 、 函 数 调 用 、 读 、 写 或 跳 转 语句 。 
我 们 再 次 用 语法 分 类 和 扩展 它 的 产生 式 代 替 了 这 一 终结 符 。 

这 里 要 用 < 语句 > 表示 C 语 言语 句 的 语法 分 类 。 形成 语句 的 方式 之 一 是 通过 while 结 构 。 也 就 
是 说 ， 如 果 有 一 条 可 作为 循环 体 的 语句 ， 就 可 以 在 它 之 前 加 上 关键 词 while 和 囊括 号 的 条 件 ， 
从 而 形成 男 一 条 语句 。 对 应 这 一 语句 形成 规则 的 产生 式 为 

< 语句 > 一 while (条 件 ) < 语句 > 
另 一 种 构建 语句 的 方式 是 通过 选择 语句 。 这 些 语句 具有 两 种 形式 ， 取 决 于 是 否 有 else 部 分 ， 它 
们 可 以 用 以 下 两 个 产生 式 表 示 

< 语句 > 一 if (条 件 ) < 语句 > 

< 语句 > 一 i£ (条 件 ) < 语句 >else< 语 句 > 

还 有 其 他 的 语句 形成 方式 ， 比 如 for 语 句 、repeat 语 名 和 case 语 句 。 这 里 将 表示 它们 的 产 
生 式 留 作 本 市 习题 ， 它 们 从 实质 上 讲 与 我 们 已 经 看 到 的 产生 式 是 类 似 的 。 

不 过 ， 还 有 男 一 种 重要 的 形成 规则 一 一 程序 块 ， 它 与 我 们 已 经 看 到 的 那些 多 少 有 些 区 别 。 
程序 块 是 由 花 括 号 {和 } 包 围 0 条 或 更 多 语句 构成 的 。 要 描述 程序 块 ， 就 需要 一 个 补充 语法 分 类 ， 
这 里 将 其 称 为 < 语句 列 >， 它 代表 一 列 语句 。 对 应 < 语句 列 > 的 产生 式 很 简单 ， 就 是 
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< 语句 列 > 一 6 

< 语句 列 > 一 < 语句 列 > < 语句 > 
也 就 是 说 ， 第 一 个 产生 式 说 明 语 句 列 可 以 为 空 。 而 第 二 个 产生 式 则 表示 如 果 在 一 列 语句 后 再 加 
上 男 一 条 语句 ， 还 是 会 得 到 一 列 语句 。 

现在 就 可 以 定义 由 语句 列 围 上 {和} 构成 的 程序 块 语句 了 ， 也 就 是 

< 语句 > 一 (< 语句 列 > ) 
我 们 已 经 给 出 的 这 些 产生 式 , 加 上 陈述 了 语句 可 以 是 简单 语句 ( 赋值 、 调 用 、 输 入 /输出 或 跳 转 ) 
跟 上 分 号 的 依据 产生 式 ， 就 如 图 11-5 所 示 。 











< 语句 > 一 while (条 件 ) < 语句 > 

< 语句 > 一 if (语句 ) < 语句 > 

< 语句 一 if (语句 ) < 语句 >else< 语 名 > 
< 语句 >> 一 {< 语句 列 >>} 

< 语句 > 一 简单 语句 ， 


< 语句 列 >> 一 € 
< 语句 列 > 一 < 语句 列 >< 语 和 句 > 





图 11-5 定义 了 C 语 言 中 茶 些 语句 形成 方式 的 产生 式 


11.2.2 “习题 


(1) 为 所 有 属于 C 语 言 标识 符 的 字符 串 给 出 定义 了 语法 分 类 < 标识 符 > 的 文法 。 大 家 会 看 到 ， 定 义 一 些 
像 < 数码 > 这 样 的 辅助 语法 分 类 是 很 实用 的 。 

(2) C 语 言 中 的 算术 表达 式 可 以 接受 标识 竺 和 数字 作为 操作 数 。 修 改 图 11-2 中 的 文法 , 使 得 操作 数 也 可 
以 是 标识 符 。 使 用 习题 (1) 中 得 到 的 文法 来 定义 标识 符 。 

(3) 数字 可 以 是 实数 ， 有 着 小 数 点 和 10 的 任意 乘 方 , 也 可 以 是 整数 。 修 改 图 11-2 中 表示 表达 式 的 文法 ， 
或 修改 习题 (2) 中 写 出 的 文法 ， 人 允许 实数 作为 操作 数 。 

(4) * C 语 言 算术 表达 式 的 操作 数 还 可 以 是 涉及 指针 (* 和 & 运 算 符 ) 的 表达 式 ， 记 录 结 构 体 的 字段 〈 . 
和 -> 运算 符 ) 或 数组 索引 。 数 组 的 索引 可 以 是 任意 表达 式 。 

(a) 为 用 来 定义 由 一 对 方 括号 包围 表达 式 构成 的 字符 串 的 语法 分 类 < 数组 引用 > 写 出 相应 文法 。 可 
以 利用 语法 分 类 < 表达 式 > 作为 辅助 。 

(b) 为 用 来 定义 作为 操作 数 的 字符 串 的 语法 分 类 < 名 字 > 写 出 相应 文法 。 就 像 1.4 节 中 介绍 过 的 那 
样 ，(*a) .b[c] [qd] 就 是 个 名 字 。 可 以 利用 语法 分 类 < 数组 引用 > 作为 辅助 。 

(c) 为 允许 使 用 名 字 作 为 操作 数 的 算术 表达 式 写 出 相应 文法 。 可 以 使 用 语法 分 类 < 名 字 > 作 为 辅助 。 
在 将 (a)、(b)、(c) 这 3 个 小 题 得 到 的 产生 式 结合 在 一 起 后 , 能 否 得 到 允许 a[b.c] [*dq] +e 这 种 表 
达 式 存在 的 文法 ? 

(5)* 证 明 图 11-4 的 文法 可 以 生成 2.6 节 中 定义 的 量变 平衡 括号 串 。 提 示 : 与 2.6 节 中 的 证 明 过 程 类 似 ， 
要 两 次 用 到 对 括号 串 长 度 的 归纳 。 

(6)* 有 时 候 表达 式 可 以 有 两 种 或 更 多 种 平衡 括号 ,例如 ,CC 语言 表达 式 可 以 同时 具有 加 括号 和 方 括号 ， 
而 且 两 种 括号 肯定 都 是 平衡 的 ， 也 就 是 说 ， 每 个 (都 必须 匹配 一 个 ) ， 而 每 个 [都 必须 匹配 一 个 ] 。 
为 具有 这 两 种 类 型 括号 的 平衡 括号 串 写 出 相应 文法 。 也 就 是 说 ， 该 文法 生成 的 平衡 括号 串 只 能 是 
格式 标准 的 C 语 言 表 达 式 中 可 能 出 现 的 那些 。 

(7) 为 图 11-$ 中 的 文法 添加 定义 for 语 句 、dqo-while 语 句 和 switch 语 句 的 产生 式 。 可 以 恰当 地 使 用 抽 
象 终结 符 和 辅助 语法 分 类 。 
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(8)* 扩展 示例 11.3 中 的 抽象 终结 符 条 件 ， 以 体现 逻辑 运算 符 的 使 用 。 也 就 是 说 ， 定 义 语 法 分 类 < 条 
件 > 取 代 抽 象 终结 符 条 件 。 可 以 使 用 抽象 终结 符 比 较 表 示 x+1<y+z 这 样 的 比较 表达 式 ， 然 后 以 
利用 < 这 样 的 比较 运算 符 表 示 的 语法 分 类 < 比较 > 和 语法 分 类 < 表达 式 > 替代 抽象 终结 符 比 较 。 语 
法 分 类 < 表达 式 > 可 以 像 11.2 节 开头 那样 粗略 定义 ， 不 过 还 要 加 上 C 语 言 中 的 其 他 运算 符 ， 比 如 
一 元 减 号 和 %。 

(9) ** 写 出 可 以 定义 语法 分 类 < 简单 语句 > 的 产生 式 , 替换 图 11-5 中 的 抽象 终结 符 简单 语句 。 可 以 假设 
语法 分 类 < 表达 式 > 代表 了 C 语 言 算术 表达 式 。 回 想 一 下 , 简单 语句 可 以 是 赋值 、 函 数 调用 或 跳 转 
语句 ， 而 且 严 格 来 说 ， 空 串 也 是 简单 语句 。 


11.3 ” 源 目 文法 的 语言 


文法 从 本 质 上 讲 是 涉及 字符 串 集 合 的 归纳 定义 。2.6 节 中 那些 归纳 定义 的 示例 与 11.2 节 中 很 
多 例子 的 主要 区 别 在 于 ， 对 文法 而 言 ， 一 种 文法 定义 奋 干 语法 分 类 的 情况 很 常见 。 而 2.6 节 中 各 
个 例子 都 定义 了 单独 的 概念 。 虽然 存在 这 种 区 别 , 但 2.6 节 中 用 来 构建 已 定义 对 象 集合 的 方法 也 
适用 于 文法 。 对 某 文 法 的 各 语法 分 类 <5> 而 言 ， 可 以 按照 如 下 方式 定义 语言 L(<5>)。 

依据 。 首 先 假设 对 文法 中 的 各 语法 分 类 <5> 而 言 ， 语 言 L(<S>) 为 空 。 

归纳 。 假设 该 文法 具有 产生 式 <S > 一 匀 XY,…, ， 其 中 对 i=1.2、…:、n ,各 个 XY 要 么 是 语法 
分 类 ， 要 么 是 终结 符 。 并 且 对 i=12、…:、n ， 按 照 如 下 方式 为 各 个 选择 一 个 字符 串 s;。 

(1) 如 果 忆 是 终结 符 ， 就 可 以 只 使 用 马 作 为 字符 串 w。 

(2) 如 果 和 是 语法 分 类 ， 就 可 以 选择 任何 一 个 已 知 在 Z( 铝 中 的 字符 串 作 为 w%。 如 果 在 干 个 已 
是 相同 的 语法 分 类 ， 就 可 以 从 各 次 出 现 的 ZCO) 中 分 别 选 不 同 的 字符 串 作 为 w。 

那么 所 选 的 这 些 字 符 串 的 串 接 ws …s%， 就 是 语言 Z(<S>) 中 的 字符 串 。 请 注意 ， 如 果 ” = 0， 
就 把 e 放 到 该 语言 中 。 

实现 这 一 定义 的 一 种 系统 化 方法 是 经 过 该 文法 各 产生 式 硅 干 轮 。 在 每 轮 中 ， 我 们 要 以 所 有 
可 能 的 方式 利用 归纳 规则 更 新 各 语法 分 类 的 语言 。 也 就 是 说 ， 对 各 个 属于 语法 分 类 的 了 ,要 以 
所 有 可 能 的 方式 从 LOW) 中 选 出 字符 串 。 


+ 示例 11.4 

考虑 一 种 由 示例 11.3 介 绍 的 与 某 几 种 C 语 言语 句 对 应 的 文法 中 的 一 些 产 生 式 组 成 的 文法 。 人 简 
单 起 见 ， 我 们 只 会 用 到 对 应 while 语 句 、 程 序 块 和 简单 语句 的 产生 式 ， 以 及 对 应 语句 列 的 两 个 
产生 式 。 此 外 ， 还 要 使 用 简略 表示 法 来 合理 压缩 这 些 字符 串 的 长 度 。 简 略 表 示 用 到 了 终结 符 w 
(while )、c( 带 括 号 的 条 件 ) 和 s ( 简单 语句 ) 该 文法 使 用 语法 分 类 <S> 表 示 语 句 ， 并 使 用 语法 
分 类 <L> 表 示 语 句 列 。 该 文法 的 产生 式 如 图 11-6 所 示 。 























<9> 一 WwWCc<9> 
<9> — {<L>} 
DS = 


<L> 一 <L> <S> 
<L> 一 上 


图 11-6 ”简化 过 的 表示 语句 的 文法 
设 Z 是 语法 分 类 <ZL> 中 字符 串 的 语言 ， 并 设 5 是 语法 分 类 <S> 中 字符 串 的 语言 。 一 开始 ,根据 
依据 规则 ,，Z 和 45 都 为 空 。 在 第 一 轮 中 ， 只 有 产生 式 (G3) 和 产生 式 (5) 是 有 用 的 ,因为 其 他 产生 式 的 
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右 部 都 含有 语法 分 类 ， 而 此 时 对 应 这 些 语 法 分 类 的 语言 中 还 没有 任何 字符 串 。 产 生 式 (3) 表 明了 
s; 是 语言 $ 中 的 字符 串 ， 而 产生 式 (5) 则 告诉 我 们 e 在 语言 Z 中 。 

第 二 轮 开 始 时 ， 有 L = {ec} 和 S = {s;}。 产 生 式 (1) 现 在 让 我 们 可 以 把 wcs; 添 加 到 Ss 中 ， 因 为 
s; 已 经 在 S 中 了 。 也 就 是 说 ， 在 产生 式 (1) 的 右 部 中 ,终结 符 w 和 c 只 能 代表 它们 本 和 号 ， 语 法 分 类 
<S> 则 可 以 被 替换 为 语言 $ 中 的 任意 字符 串 。 因 为 目前 s; 是 $ 中 唯一 的 字符 串 , 所 以 我 们 只 能 作出 
这 一 个 选择 ， 而 这 一 选择 的 结果 就 是 wes;。 

产生 式 (2) 添 加 了 字符 串 {}， 因 为 终结 符 { 和 } 只 能 代表 它们 自 遇 ,不 过 语法 分 类 <L> 可 以 代 
表 语 言 Z 中 的 任意 字符 串 ， 而 此 刻 Z 中 只 含有 e 。 

因为 产生 式 (3) 的 右 部 只 由 终结 符 构 成 ， 所 以 它 决 不 会 产生 除 s; 之 外 的 字符 串 ， 因 此 从 现在 
开始 就 可 以 忘掉 该 产生 式 了 。 同 样 ,， 产生 式 (5$) 也 不 会 产生 除 e 之 外 的 字符 串 ， 所 以 在 本 轮 及 以 
后 的 轮 次 中 也 可 以 忽略 它 。 

最 后 ， 当 我 们 用 e 代替 <Z> 并 用 sg; 代替 <y> 之 后 ,产生 式 (4) 就 为 Z 产 生 了 字符 串 s;。 在 第 二 
轮 结束 的 时 候 ， 语 言 $= 二 {s; wes; ,人 ， 而 语言 L = {ec ; s;}。 

在 下 一 轮 中 ,可 以 使 用 产生 式 (1)、(2) 和 (4) 产 生 新 的 字符 串 。 产 生 式 (1) 中 替换 <S> 的 选择 有 
3 种 ， 分 别 是 s; 、wcs; 和 {}。 用 s; 蔡 换 后 得 到 的 字符 串 是 语言 中 已 经 具有 的 ， 不 过 替换 了 男 两 
个 字符 串 后 得 到 的 是 新 字符 串 wcwcs; 和 wc{}。 

对 产生 式 (2) 而 言 ,可 以 用 e 或 s; 蔡 换 <L>,， 为 语言 S 得 出 旧 字 符 串 {} 和 新 字符 串 {s;}。 在 产 
生 式 (9) 中 ， 可 以 用 e 或 s; 蔡 换 <L>， 并 用 s; 、wes; 或 1 替换 <S>， 这 给 语言 Z 带 来 了 一 个 旧 字 符 
串 s;， 以 及 5 个 新 字符 串 wes; 、{] 、s;s;、sjwcsy 和 sj;ift]。” 

这 样 语言 就 成 了 S={s;,wcs;,f,wcwcs;,wcf},{s;} 和 L={c,s;,wces;,{},s;s;,s;wcs;,s;{}} 。 
我 们 可 以 按照 自己 的 意愿 继续 这 一 过 程 。 图 11-7 总 结 了 前 3 轮 的 情况 。 

Nr | 
Round | s; 


Round 2: WCS; 
{} 


























Round 3: WCWCS; 
wc{} 
{s;} 


图 11-7 前 3 轮 每 轮 产生 的 新 字符 串 


正如 示例 11.4 中 那样 ， 由 文法 定义 的 语言 可 能 是 无 限 的 。 如 有 果 语 言 是 无 限 的 ， 我 们 就 不 能 一 
一 列 出 所 有 字符 串 。 能 做 到 的 最 佳 做 法 就 是 按 轮 次 枚 举 这 些 字 符 串 ， 就 像 示 例 11.4 中 一 开始 所 做 
的 那样 。 该 语言 中 的 任何 字符 串 都 将 在 某 轮 出 现 , 不 过 在 任何 一 轮 都 不 可 能 产生 出 所 有 的 字符 串 。 
可 以 被 放 进 语法 分 类 <S> 的 语言 中 的 那些 字符 串 组 成 的 集合 ， 就 形成 了 《无 限 ) 语言 L(<5>)。 


Q 我 们 非常 关心 用 字符 串 替换 语法 分 类 的 方式 。 假 设 经 过 每 一 轮 替 换 ， 语 言 Z 和 5 都 和 它们 在 上 一 轮 结束 时 的 定义 保 
持 不 变 。 每 个 产生 式 的 右 部 都 要 进行 替换 。 这 些 右 部 可 以 为 左 部 的 语法 分 类 产生 新 的 字符 串 ， 不 过 在 同一 轮 蔡 换 
中 , 我们 不 会 在 一 个 产生 式 的 右 部 使 用 由 另 一 个 产生 式 新 构建 的 字符 串 。 但 这 也 没关系 ， 所 有 要 生成 的 字符 串 最 
终 都 会 在 某 一 轮 中 生成 ， 不 管 我 们 是 立即 在 右 部 中 循环 使 用 新 字符 串 ， 还 是 等 待 在 下 一 轮 中 再 使 用 新 字符 串 。 
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习题 
(1) 在 示例 11.4 中 ， 第 四 轮 添加 的 新 字符 串 都 有 哪些 ? 
(2)* 在 示例 11.4 的 第 礁 蔡 换 中 ， 为 各 语法 分 类 产生 的 新 字符 串 中 最 短 的 字符 串 各 是 什么 ? 为 下 列 语 
法 分 类 产生 的 最 长 新 字符 串 又 分 别 是 什么 ? 











(a) <S> 
(b) <L>? 
(3) 分 别 使 用 下 列 图 中 的 文法 按 轮 次 生成 平衡 括号 串 。 
(a) 图 11-3 
(b) 图 11-4 


这 两 种 文法 在 相同 轮 次 中 是 否 会 生成 相同 的 平衡 括号 串 ? 
(4) 假设 每 个 以 某 语法 分 类 <S> 为 其 左 部 的 产生 式 在 其 右 部 中 也 含有 <S> ， 那 么 为 什么 L(<S>) 为 空 ? 
(5)* 在 如 本 节 所 描述 的 方式 按 轮 次 生成 字符 串 时 , 为 语法 分 类 <S> 生 成 的 新 字符 串 只 可 能 是 通过 替换 
某 有 关 <S> 的 产生 式 中 右 部 的 语法 分 类 得 到 ， 满 足 至 少 有 一 个 被 替换 的 字符 串 是 在 上 一 轮 中 新 发 
现 的 。 解 释 一 下 为 什么 楷体 标记 的 条 件 是 正确 的 。 
(6) ** 假设 我 们 想 分 辨 某 个 特定 的 字符 串 * 是 否 在 某 语 法 分 类 <S> 的 语言 中 。 
(a) 解释 一 下 ， 为 什么 如 果 在 某 轮 中 所 有 为 任意 语法 分 类 生成 的 新 字符 串 都 比 s 长 ， 而 且 s 尚 未 为 
ZL(<S>) 生 成 ，s 就 不 可 能 被 放 入 L(<S>) 中 。 提 示 : 利用 习题 (5)。 
(b) 解释 一 下 ， 为 什么 在 有 限 轮 次 的 蔡 换 后 ， 一 定 没 法 继续 生成 不 长 于 s 的 新 字符 串 。 
(c) 使 用 (a) 和 (b) 的 结论 设计 一 种 算法 ,接受 某 文法 、 该 文法 的 一 种 语法 分 类 <S>， 以 及 某 个 终结 
符 串 s， 并 分 辨 出 s 是 否 在 L(<5>) 中 。 
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正如 我 们 已 经 看 到 的 ， 通 过 反复 应 用 产生 式 ， 可 以 为 某 语 法 分 类 <5> 得 出 字符 串 s 属 于 语言 
ZL(<S>) 的 结论 。 从 由 右 部 中 不 含 语法 分 类 的 依据 产生 式 得 到 的 字符 串 开始 。 然后, 对 已 经 从 各 语 
法 分 类 得 到 的 字符 串 “ 应 用 ”产生 式 。 每 次 应 用 都 要 用 字符 串 蔡 换 产生 式 右 部 中 出 现 的 各 语法 
分 类 ,并 构造 出 属于 产生 式 左 部 中 语法 分 类 的 字符 串 。 最终, 我们 将 通过 应 用 左 部 为 <$> 的 产生 
式 来 构造 字符 串 s。 

把 s 在 ZI(<5>) 中 的 “证 明 ” 画 成 一 棵 称 作 分 析 树 ( parse tree ) 的 树 往 往 是 很 实用 的 。 分 析 树 
的 节点 都 是 带 标 号 的 ， 要 么 是 终结 符 ， 要么 是 语法 分 类 ， 要 么 是 符号 e 。 叶 子 节点 只 会 被 标记 
为 终结 符 或 符号 e ， 而 内 部 节点 只 可 能 用 语法 分 类 作为 标号 。 

每 个 内 部 节点 v 都 表示 产生 式 的 应 用 。 也 就 是 说 ， 一 定 存在 某 个 产生 式 同 时 满足 下 列 条 件 : 

(1) 标号 v 的 语法 分 类 是 该 产生 式 的 左 部 ; 

(2) v 的 子 节 点 的 标号 从 左 往 右 构成 了 该 产生 式 的 右 部 。 


+ 示例 11.5 
图 11-8 展 示 了 一 棵 基于 图 11-2 所 示 文 法 的 分 析 树 。 不 过 ,在 这 里 我 们 把 语法 分 类 < 表达 式 >、 
< 数字 > 和 < 数码 > 分 别 简称 为 <E>、<N> 和 <D>。 该 分 析 树 表示 的 字符 串 是 3* (2+14)。 
例如 ， 这 棵 分 析 树 的 根 节 点 及 其 子 节点 就 表示 产生 式 
<E>— <E> * <E> 
就 是 图 11-2 中 的 产生 式 (6)。 根 节点 的 最 右 子 节点 及 其 子 节点 形成 了 产生 式 <E> 一 (<E>)， 
或 者 说 是 图 11-2 中 的 产生 式 (5)。 
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<E> 








3 <N> <N> 
<D> ZNS <DS 
2 <D> 4 


图 11-8 ”使 用 图 11-2 所 示 文 法 的 字符 串 3x (2+14) 对 应 的 分 析 树 


11.4.1 分 析 树 的 构建 


每 棵 分 析 树 都 表示 某 一 终结 符 串 s， 我 们 可 将 该 串 称 为 这 棵 树 的 产 出 ( yield )。 串 * 由 相应 分 
析 树 所 有 叶子 节点 的 标号 按照 从 左 到 右 的 次 序 排列 而 成 。 此 外 ， 通 过 对 分 析 树 进行 前 序 遍 历 并 
只 依次 列 出 那些 属于 终结 符 的 标号 ， 我 们 也 可 以 得 到 这 一 产 出 。 例 如 ， 图 11-8 所 示 分 析 树 的 产 
出 就 是 3* (2+14) 。 

如 果树 只 有 一 个 节点 ， 那 么 该 节点 的 标号 就 只 能 是 某 个 终结 符 或 者 ce ， 因 为 它 是 个 叶子 市 
点 。 如 果 该 树 不 止 有 一 个 节点 ， 那 么 根 市 点 的 标号 就 是 语法 分 类 ， 因 为 在 一 棵 有 两 个 或 更 多 个 
节点 的 树 中 ， 根 节点 总 是 个 内 部 节点 。 而 且 该 语法 分 类 的 字 字符 串 中 总 是 会 包含 该 树 的 产 出 。 与 
某 给 定 文法 对 应 的 分 析 树 的 归纳 定义 如 下 所 述 。 

依据 。 对 文法 中 的 每 个 终结 符 x 来 说 ， 存 在 一 棵 只 含 一 个 标号 为 x 的 节点 的 树 。 当 然 ， 该 树 
的 产 出 就 是 x。 

归纳 。 假设 我 们 有 产生 式 <S > 一 他 X,…X, ,其 中 各 个 要 么 是 终结 符 , 要 么 是 语法 分 类 。 
如 果 n = 0， 也 就 是 说 ， 该 产生 式 实 为 <S> 一 e ， 那 么 就 有 一 棵 像 图 11-9 这 样 的 树 。 其 产 出 为 e ， 
而 且 根 节点 为 <$>>， 因 为 有 该 产生 式 ， 所 以 空 串 e 显然 是 在 Z(<S>) 中 的 。 


<9>> 

















€ 
图 11-9 由 产生 式 <S> 一 e 得 到 的 分 析 树 
现在 假设 <5S > 一 对,… 子 ,而且 n 宇 1 我 们 可 以 按照 如 下 方式 , 对 每 个 i=12、…:、n 而 言 ， 
为 各 个 ,选择 树 7 。 
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(1) 如 果 ,是 终结 符 ， 就 必须 选择 标号 为 ,的 单 节 点 树 。 如 果 有 两 个 或 多 个 X 是 同一 终结 
符 ， 就 必须 为 该 终结 符 的 每 次 出 现 选择 具有 相同 标号 的 不 同 单 节点 树 。 

(2) 如 果 闷 是 语法 分 类 ， 我 们 可 以 选择 任何 已 经 构建 好 的 以 成 作为 根 节 点 标号 的 分 析 树 ， 
然后 构建 一 棵 像 图 11-10 这 样 的 树 。 也 就 是 说 ,我 们 创建 的 根 节 点 标号 是 该 产生 式 左 部 的 语法 分 
类 <5>, 而 这 棵 树 根 顾 点 的 子 三 点 从 左 到 右 依 次 是 为 和 、 句 、…、 己 ,选择 的 树 的 根 证 点 。 如 果 有 两 
个 或 多 个 X 是 相同 的 语法 分 类 ， 我 们 也 许 要 为 各 语法 分 类 选择 相同 的 树 ， 但 是 必须 在 该 树 每 次 
被 选中 时 为 其 生成 不 同 的 副本 。 我 们 还 可 以 为 同一 语法 分 类 的 不 同 出 现 选择 不 同 的 树 。 

















0 
公公 从 


图 11-10 利用 产生 式 和 其 他 分 析 树 构建 分 析 树 


+ 示例 11.6 

我 们 来 研究 一 下 图 11-8 中 分 析 树 的 构造 ， 看 看 它 的 结构 是 如 何 模仿 证 明 字 符 串 3* (2+14) 
在 L(<E>) 中 的 过 程 的 。 首先, 可 以 为 该 树 中 的 各 个 终结 符 构造 一 棵 单 节 点 树 。 然 后 图 11-2 中 第 (1) 
行 的 产生 式 组 说 明了 10 个 数码 都 是 属于 Z(<D>) 的 长 度 为 1 的 字符 串 。 我 们 用 到 其 中 的 4 个 产生 式 
创建 图 11-11 所 示 的 4 棵 树 。 例 如 ， 我 们 利用 产生 式 <D> 一 1 按照 如 下 方式 创建 了 图 11-11a 中 的 分 
析 树 ， 为 右 部 中 的 符号 1 创建 一 棵 只 有 一 个 标号 为 1 的 节点 的 树 ， 然 后 ， 创 建 一 个 标号 为 <D> 的 





节点 作为 根 节点 ， 并 以 我 们 为 1 选择 的 树 的 根 节 点 〈 也 是 唯一 的 节点 ) 作为 其 子 节 点 。 
DS <D> Dy <D> 
1 2 3 4 


(a) (b) (c) (d) 
图 11-11 使 用 产生 式 <D> 一 1 以 及 相似 的 产生 式 构建 的 分 析 树 
下 一 步 是 要 利用 图 11-2 中 的 产生 式 (2)， 或 者 说 是 <N> 一 <D>， 来 揭示 数码 就 是 数字 这 一 事 
实 。 例 如， 可 以 选择 图 11-11a 所 示 的 树 蔡 换 产 生 式 (2) 右 部 中 的 <D>, 得 出 图 11-12a 所 示 的 树 。 图 
11-12 中 的 男 两 棵 树 也 是 用 相似 的 方式 产生 的 。 


<N> <N> <N> 
<D> <D> <D> 
二 2 2 


(a) (b) (c) 
图 11-12 ”使 用 产生 式 <N> 一 <D> 构 建 的 分 析 树 
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现在 可 以 利用 产生 式 (3), 也 就 是 <N> 一 <N> <D> 了 。 我 们 将 会 为 右 部 中 的 <N> 选 择 图 11-12a 
所 示 的 树 ， 并 为 <D> 选 择 图 11-11d 所 示 的 树 。 还 要 为 左 部 创建 一 个 标号 为 <N> 的 新 节点 ， 并 为 该 
节点 指定 两 个 子 节点 ,也 就 是 选中 的 两 棵 树 的 根 节点 。 得 到 的 树 如 图 11-13 所 示 。 该 树 的 产 出 是 
数字 14。 





<N> 


<N> <D> 


<D> 4 


1 
图 11-13 ”用 产生 式 <N> 一 <N> <D> 构 建 的 分 析 树 


下 一 个 任务 就 是 为 和 2+14 创 建 分 析 树 。 首 先 ， 我 们 要 用 到 产生 式 (4)， 即 <E> 一 <N>， 以 
建立 图 11-14 所 示 的 分 析 树 。 这 些 树 表明 了 3 、2 和 14 都 是 表达 式 。 这 些 树 中 的 第 一 棵 源 自 图 11-12c 
中 为 右 部 中 的 <N> 选 择 的 树 , 第 二 棵 是 通过 图 11-12b 中 为 <N> 选 择 的 树 得 到 的 ,而 第 三 棵 则 是 选 
择 图 11-13 中 的 树 得 到 的 。 

然后 可 以 使 用 产生 式 (6)， 也 就 是 <E> 一 <E> + <E>。 对 右 部 中 的 第 一 个 <B>， 我 们 使 用 了 
图 11-14b 中 的 树 ， 而 对 右 部 中 的 第 二 个 <E>， 则 是 使 用 了 图 11-14c 所 示 的 树 。 为 右 部 中 的 + 使 用 
的 是 一 棵 标号 为 + 的 单 节点 树 。 得 到 的 树 如 图 11-15 所 示 ， 其 产 出 为 2+14。 











<E> <E> <E> 
<N> <N> <N> 
| | A 
<D> <D> <NS” DS 
2 2 <D> 4 
(a) (b) | 
1 


(oj 
图 11-14 ”使 用 产生 式 <E> 一 <N> 构 建 的 分 析 树 


接 下 来 要 用 到 产生 式 (5)， 或 者 说 是 < 有 一 (<E>)， 构 建 图 11-16 所 示 的 分 析 树 。 我 们 只 要 为 
右 部 中 的 <E> 选 择 图 11-15 中 的 树 ， 并 为 终结 符 括号 选择 单 节 点 树 即 可 。 

最 后 ， 利 用 产生 式 (8)， 也 就 是 <E> 一 <E> * <E>， 构 建 了 我 们 最 初 在 图 11-8 中 展示 的 分 
析 树 。 我 们 为 右 部 中 的 第 一 个 <E> 选 择 了 图 11-14a 所 示 的 树 ， 并 为 第 二 个 <E> 选 择 了 图 11-16 
中 的 树 。 
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<E> 





<E> + <E> 


<N> <N> 
| ZN 
| J 
<D> <NS <DS 
2 <D> 4 


图 11-15 ”使 用 产生 式 <E> 一 <E> + <E> 构 建 的 分 析 树 





<E> + <E> 


<N> <N> 
<D> <N> <D> 
2 <D> 4 


1 
图 11-16 ”使 用 产生 式 <E> 一 (<) 构建 的 分 析 树 


11.4.2 分析 树 为 何 “ 行 得 通 ” 

分 析 树 的 构建 与 字符 串 属于 某 语法 分 类 的 归纳 定义 非常 相似 。 我 们 可 以 通过 两 次 简单 的 归 
纳 来 证 明 , 对 任意 语法 分 类 <5> 来 说 , 以 <5> 为 根 节点 的 分 析 树 的 产 出 刚好 是 ZL(<5>) 中 的 字符 串 。 
也 就 是 如 下 两 点 。 

(1) 如 果 7 是 根 节点 标号 为 <S> 而 且 产 出 为 * 的 分 析 树 ， 那 么 字符 串 s 在 语言 ZC(<S>) 中 。 

(2) 如 果 字 符 串 s 在 语言 Z(<S>) 中 ， 那 么 存在 产 出 为 * 且 根 节 点 标号 为 <S> 的 分 析 树 。 

这 一 等 价 关 系 应 该 是 相当 直观 的 。 粗 略 地 讲 ， 分 析 树 是 由 更 小 的 分 析 树 ， 按 照 由 较 短 的 字 
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符 串 构成 长 字符 串 的 方式 ， 对 产生 式 右 部 中 的 语法 分 类 进行 蔡 换 构成 的 。 我 们 首先 利用 对 树 7 
高 度 的 完全 归纳 证 明 第 (1) 部 分 。 

依据 。 假 设 分 析 树 的 高 度 是 1。 那 么 这 棵 树 就 像 图 11-17 所 示 的 这 样 ， 或者， 在 n = 0 的 特例 
中 ， 就 像 图 11-9 所 示 的 树 那样 。 构 建 这 种 树 的 唯一 方法 是 ， 若 存在 产生 式 <S> 一 x, zx， 其 中 
各 x 都 是 终结 符 (如 果 n = 0， 该 产生 式 就 是 <S> 一 e )。 因 此 x，x…zx, 是 L(<5>) 中 的 字符 串 。 


ee 


rs. Xn 











图 11-17 ”高度 为 1 的 分 析 树 


归纳 .假设 命题 (1) 对 所 有 高 度 不 超过 Kk 的 树 都 成 立 。 现 在 考虑 像 图 11-10 那 样 高 度 为 f+1 的 树 。 
那么 ， 对 i= 1、2、…、n， 各 子 树 T 的 高 度 至 多 为 £。 如 果 这 些 子 树 中 有 任何 一 棵 的 高 度 达 到 或 超 
过 kt+1， 那 么 整 棵 树 的 高 度 就 至 少 是 xt2。 因 此 ， 归 纳 假设 适用 于 各 棵 树 7。 

根据 归纳 假设 ， 如 果子 树 T 的 根 节 点 入 是 语法 分 类 ， 那 么 T 产 出 s 就 在 语言 L(2) 中 。 如 果 廊 
是 终结 符 ， 就 定义 字符 串 s 是 蕊 ， 那 么 整 棵 树 的 产 出 就 是 ws ……s，。 

根据 分 析 树 的 定义 ， 可 知 <S> 一 系 忒 … 苞 是 产生 式 。 假 设 只 要 和 是 语法 分 类 就 用 sw 替换 已。 
根据 定义 ， 如 果 2 是 终结 符 ， 马 就 是 ws。 这 样 一 来 ， 蔡 换 后 的 右 部 就 成 了 sis,…s, ， 与 该 树 的 产 
出 是 相同 的 。 根 据 <S> 的 语言 的 归纳 规则 ， 我 们 知道 ss,…s, 是 在 Z(<S>) 中 的 。 

现在 必须 证 明 命 题 (2)， 语 法 分 类 Z<S> 中 的 每 个 字符 串 s 都 具有 以 <S> 为 根 节 点 且 以 * 为 产 出 
的 分 析 树 。 首 先 要 注意 到 ， 对 每 个 终结 符 x， 存 在 根 市 点 和 产 出 都 是 x 的 分 析 树 。 现 在 我 们 要 对 
得 出 s 在 Z(<S>) 中 时 的 归纳 步骤 (如 11.3 节 所 述 ， 下 面 的 证 明 中 加 引号 的 “归纳 步 又 ”就 是 表示 
该 归纳 步骤 ) 的 应 用 次 数 进行 完全 归纳 。 

依据 。 假 设 证 明 s 在 L(<5>) 中 需要 应 用 “归纳 步骤 ”一 次 。 则 一 定 存在 产生 式 <S> 一 zx xz 
x,， 其 中 所 有 的 x 都 是 终结 符 ， 而 且 <5> = x，x…zx,。 我 们 知道 对 i = 1、2、…、n， 都 有 标号 为 
X, 的 单 节 点 分 析 树 。 因 此 ， 存 在 产 出 为 * 且 根 节 点 标号 为 <S$> 的 分 析 树 ， 该 树 的 样子 类 似 图 11-17 
所 示 。 在 n = 0 的 特例 中 ， 我 们 知道 s= e ， 此 时 就 要 使 用 图 11-9 所 示 的 树 。 

归纳 。 假 设 应 用 “归纳 步 绝 ”不 超过 A 次 所 发 现 的 任意 语法 分 类 <7> 的 语言 中 ， 任 何 字 符 串 
t 都 具有 以 1 为 产 出 而 且 以 <7> 为 根 市 点 的 分 析 树 。 考 虑 通过 Kk+1 次 应 用 “归纳 步骤 ”找到 的 在 语 
法 分 类 <5> 的 语言 中 的 字符 串 s。 那 么 ， 存 在 产生 式 <S > 一 久 XY,… 卫 ,， 且 ss = ss,…s, ， 其 中 每 
个 子 串 s, 都 会 是 如 下 两 种 可 能 之 一 。 

(1) 为 入 ( 如 果 无 是 终结 符 )。 

(2) 某 个 至 多 应 用 次 “归纳 步 台 ”就 可 知 在 L(2) 中 的 字符 串 ( 如 果 厂 是 语法 分 类 )。 

因此 , 对 每 个 i, 都 可 以 找到 一 棵 具有 产 出 s; 而 且 根 节点 标号 为 的 树 T。 如 果 大 是 语法 分 类 ， 
那么 就 利用 归纳 假设 声明 7 存在 , 而 如 果 达 是 终结 符 , 则 不 需要 归纳 假设 就 可 以 声明 存在 标号 为 
也 的 单 节点 树 。 因 此 ， 如 图 11-10 中 那样 构建 的 树 具 有 产 出 s 而 且 根 节点 标号 为 <S>， 这 样 就 证 明 
了 该 归纳 步骤 。 


11.4.3 “习题 
(1) 根据 图 11-2 所 示 的 文法 ， 为 以 下 字符 串 给 出 相应 的 分 析 树 。 在 各 情况 中 根 节 点 位 置 的 语法 分 类 都 






































11.5 二 义 性 和 文法 设计 491 





应 该 是 <E>。 
(a) 35+21 
(b) 123- (4*5) 
(c) Lx2x (3-4) 
(2) 使 用 图 11-6 中 的 语句 文法 ， 给 出 以 下 字符 串 的 分 析 树 。 其 中 每 种 情况 下 根 节 点 的 语法 分 类 都 应 该 
是 <S>。 
(a) wcwcs ; 
(b) {s;} 
(c) {s;wcs;} 
(3) 利用 图 11-3 中 的 平衡 括号 串 文 法 ， 给 出 以 下 括号 串 的 分 析 树 。 
(a) (() ()) 
(b) ((())) 
(c) ((())()) 
(4) 利用 图 11-4 中 的 文法 为 习题 (3) 中 的 各 括号 串 给 出 分 析 树 。 





语法 树 和 表达 式 树 


通常 ， 像 分 析 树 这 样 的 树 是 用 来 表示 表达 式 的 。 例 如 ， 我 们 在 第 5 章 中 通 篇 都 以 表达 式 树 为 例 。 语 
法 树 是 “表达 式 树 ”的 另 一 个 名 字 。 当 我 们 拥有 如 图 11-2 所 示 的 对 应 表达 式 的 文法 时 ,就 可 以 通过 以 下 3 
项 变形 把 分 析 树 转换 成 表达 式 树 。 

(1) 原子 操作 数 被 压缩 为 以 该 操作 数 为 标号 的 单个 节点 。 

(2) 运 算 符 从 叶子 节点 移动 到 它们 的 父 节 点 。 也 就 是 说 , 像 + 这 样 的 运算 符 符 号 成 为 了 原本 在 它 上 方 ， 
以 语法 分 类 “表达 式 ” 为 标号 的 节点 的 标号 。 

(3) 仍然 以 “表达 式 ” 为 标号 的 内 部 节点 要 删除 其 标号 。 

例如 ， 图 11-8 中 的 分 析 树 就 可 以 转化 成 如 下 表达 式 树 或 者 说 语法 树 。 





11.5 “二 义 性 和 文法 设计 





我 们 来 考虑 如 图 11-4 所 示 的 表示 平衡 括号 串 的 文法 , 这 里 用 语法 分 类 <B> 作 为 图 11-4 中 语法 
分 类 < 平衡 > 的 缩写 。 
<B>— (<B>)l<B><B>|e (11.1) 
假设 想 要 一 棵 表示 括号 串 () () () 的 分 析 树 。 图 11-18 展 示 了 两 棵 这 样 的 分 析 树 ， 第 一 棵 是 
把 前 两 对 括号 先 分 在 一 组 ， 而 男 一 棵 则 先 把 后 两 对 括号 分 成 一 组 。 
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司 
<BS >B> 
2 -a 多 ] Se 
<BS> <B> B 
< (Sp E 
€ € 
(a) 从 左 分 组 的 分 析 树 
<B> 
之 Se 
<BS 本 
[WE Sp 之 万 > 
<B> ) <B> ) 
€ € 
(b) 从 右 分 组 的 分 析 树 


图 11-18 有 着 同样 的 产 出 和 根 节 点 的 两 棵 分 析 树 


出 现 这 样 两 棵 分 析 树 应 该 不 会 让 人 感到 惊讶 。 一 旦 确定 () 和 () () 都 是 平衡 括号 串 ， 使 用 
产生 式 < 了 3 > 一 < 有 8 >< 呈 > 就 可 以 用 () 蔡 换 右 部 中 的 第 一 个 <B> 并 用 () () 蔡 换 第 二 个 <B>， 反 之 
亦 然 。 两 种 情况 下 ， 都 能 得 出 括号 串 () () () 在 语法 分 类 <B> 中 。 

如 果 文 法 中 有 两 棵 或 多 棵 分 析 树 具有 相同 产 出 ， 且 其 根 节点 标号 是 相同 的 语法 分 类 ， 就 说 
该 文法 是 二 义 的 〈ambiguous )。 请 注意 ， 不 一 定 要 每 个 字符 串 都 是 若干 分 析 树 的 产 出 ， 只 要 有 
一 个 这 样 的 字符 串 就 足够 让 文法 具有 二 义 性 了 。 例 如 ， 括 号 串 () () () 就 是 以 说 明文 法 (11.1) 是 
二 义 的 。 不 具 二 义 性 的 文法 叫 作 无 二 义 (unambiguous ) 文法 。 在 无 二 义 文 法 中 ， 对 每 个 字符 串 
s 和 语法 分 类 <5> 而 言 ， 至 多 存在 一 棵 产 出 为 s 且 根 节点 标号 为 <B> 的 分 析 树 。 

图 11-3 所 示 的 文法 就 是 个 无 二 义 文法 的 例子 ， 这 里 还 是 用 <S> 来 代替 < 平衡 的 >。 














<B>— (<B>)<B>le (11.2) 
证 明文 法 无 二 义 是 相当 困难 的 。 在 图 11-19 中 是 对 应 括号 串 () () () 的 唯一 一 棵 分 析 树 ， 当 


然 , 这 一 字符 串 有 着 唯一 分 析 树 的 事实 并 不 能 证 明文 法 (11.2) 就 是 无 二 义 的 。 我们 证 明 无 二 义 性 
的 唯一 方法 就 是 证 明 语 言 中 的 每 个 字符 串 都 具有 唯一 的 分 析 树 。 
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图 11-19 使 用 文法 (11.2) 表 示 字 符 串 () () () 的 唯一 分 析 树 


11.5.1 表达 却 中 的 二 义 性 


尽管 图 11-4 中 的 文法 是 二 义 的 ， 但 它 的 二 义 性 并 没有 太 大 坏处 ， 因 为 我 们 从 左 起 还 是 从 右 
起 分 组 括号 影响 不 大 。 在 考虑 表示 表达 式 的 文法 〈 比 如 11.2 节 中 国 11-2 所 示 的 文法 ) 时 , 会 发 生 
一 些 更 为 严重 的 问题 。 具 体 地 讲 ， 尽 管 一 些 分 析 树 可 以 给 出 正确 的 表达 式 值 ， 但 为 一 些 分 析 树 
表示 的 是 错误 的 值 。 





无 二 义 性 为 何 很 重要 


为 程序 构建 分 析 树 的 分 析 器 是 编译 器 的 关键 部 分 。 如 果 描 述 编程 语言 的 文法 是 二 义 的 ,而 
且 如 果 其 二 义 性 未 被 消除 ,那么 就 至 少 有 某 些 程序 具有 多 棵 分 析 树 。 而 同一 程序 不 同 的 分 析 树 
就 为 该 程序 赋予 了 不 同 的 含义 ,其 中 这 种 情况 下 “含义 ”是 指 由 原始 程序 翻译 成 的 机 器 语言 程 
序 执行 的 操作 。 因 此 ， 如 果 与 程序 对 应 的 文法 是 二 义 的 ， 编 译 器 就 不 能 正确 地 决定 该 为 某 些 程 
序 使 用 哪 棵 分 析 树 ， 所 以 就 不 能 决定 机 器 语言 程序 应 该 做 些 什 么 。 出 于 这 种 原因 ， 编 译 器 必须 
使 用 无 二 义 性 的 规范 。 





+ 示例 11.7 

这 里 用 简略 表示 法 来 表示 示例 11.5 中 给 出 的 表达 式 文法 ， 并 考虑 表达 式 1-2+3。 它 具有 两 
棵 分 析 树 ， 取 决 于 是 从 左 还 从 右 组 合 运 算 符 。 这 两 棵 分 析 树 如 图 11-20a 和 图 11-20b 所 示 。 

图 11-20a 中 的 树 是 从 左 起 结合 的 ， 因 此 操作 数 是 从 左 起 分 组 的 。 这 种 分 组 是 正确 的 ， 因 为 
我 们 一 般 会 从 左 起 分 组 优先 级 相同 的 运算 符 ，1-2+3 习 惯 被 解释 为 (1-2)+3， 其 值 为 2。 如 果 
我 们 为 构建 起 图 11-20a 所 示 树 的 子 树 表 示 的 表达 式 求 值 ， 就 要 首先 在 根 节点 的 最 左 子 节 点 处 计 
算 1-2 = -1， 然 后 在 根 节 点 计算 -1+3=2。 

另 一 方面 ， 对 从 右 侧 起 关联 的 图 11-20b, 会 把 该 表达 式 分 组 为 1-(2+3) ， 其 值 为 -4。 不 过 ， 
对 该 表达 式 的 这 种 解释 是 不 合 规定 的 。 值 -4 是 在 构建 图 11-20b 的 树 时 得 到 的 ， 因 为 我 们 先 在 根 
节点 的 最 右 子 节点 处 计算 了 2+3 = 5， 然 后 在 根 节点 处 计算 了 1-5 = -4。 

从 错误 的 方向 结合 优先 级 相等 的 运算 符 可 能 导致 问题 。 而 优先 级 不 同 的 运算 符 也 可 能 带 来 
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问题 ， 正 如 我 们 在 接 下 来 的 示例 中 要 看 到 的 ， 有 可 能 在 结合 更 高 优先 级 的 运算 符 之 前 先 结合 了 








低 优先 级 的 运算 符 。 
<E> <E> 
<E> 十 <E> <E> 二 <E> 
<E> 一 <E> <N> 人 十 <E> 
<N> <N> <DS> <D> <N> <N> 
<D> <D> 3 1 <D> <D> 
1 2 2 3 
(a) 正确 的 分 析 树 (b) 不 正确 的 分 析 树 


图 11-20 对 应 表达 式 1-2+3 的 两 棵 分 析 树 


+ 示例 11.8 

考虑 表达 式 1+2x3。 在 图 11-21a 中 ， 我 们 看 到 表达 式 是 从 左 起 分 组 的 ， 这 是 不 对 的 ， 而 图 
11-21b 所 示 的 则 是 正确 的 从 右边 起 的 分 组 ， 这 样 乘法 的 操作 数 才 在 加 法 之 前 分 组 。 前 一 种 分 组 
会 得 出 不 正确 的 值 9， 而 后 面 的 分 组 则 会 产生 合乎 规则 的 值 7。 





<E> <E> 
区 Ee ] a 

<E> 水 <E> <E> 十 <E> 
二 万 过 十 二 > AN <NS <ES 水 二 局 之 
<N> <N> <D> <D> <N> <N> 
«DS D3 3 1 <D> D> 

1 2 2 3 
(a) 不 正确 的 分 析 树 (a) 正确 的 分 析 树 


图 11-21 表示 表达 式 1+2*3 的 两 棵 分 析 树 
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11.5.2 ”表示 表达 式 的 无 二 义 文 法 


就 像 表 示 平 衡 括号 串 的 文法 (11.2) 可 以 被 视 作文 法 (11.1) 的 无 二 义 版 本 那样 ， 也 可 以 为 示 
例 11.5 中 的 表达 式 文法 构建 一 个 无 二 义 版 本 。“ 究 门 ”就 是 定义 有 着 如 下 直觉 含义 的 3 个 语法 


分 类 。 


(1)< 因 式 > 生 成 了 不 能 被 “提取 出 ”的 表达 式 , 也 就 是 说 ， 因 式 要 人 么 是 单个 操作 数 ， 要么 是 
加 了 括号 的 表达 式 。 

(2) < 项 > 生成 了 因 式 的 积 或 商 。 单 个 因 式 是 项 ， 因 此 一 列 由 * 或 /运算 符 分 隔 的 因 式 也 是 项 。 
12 和 12/3< 因 式 >*45 都 是 项 。 

(3) < 表达 式 > 生 成 了 一 项 或 多 项 的 和 或 差 。 单 个 项 就 是 个 表达 式 ， 因 此 一 列 由 + 或 -运算 符 
分 隔 的 项 也 是 表达 式 。12、12/3*45 和 12+3*45-6 都 是 表达 式 。 

图 11-22 就 是 表示 表达 式 、 项 和 因 式 间 关 系 的 文法 。 我 们 用 简写 <E>、<7> 和 < 了 > 分 别 代 表 < 
因 式 >、< 项 > 和 < 表达 式 >。 








(1) <E>— <E>+<T>|<E>— <7T>|<T> 
的 
(3) <F>— (<E>)|<N> 

(4) <N>— <N><D>|<D> 

(5) <D>—0|1|:.….|9 








图 11-22 表示 算术 表达 式 的 无 二 义 文法 


例如 ， 第 (1) 行 的 3 个 产生 式 定义 了 表达 式 要 人 么 是 较 小 的 表达 式 后 面 跟 上 + 或 -以 及 男 一 项 ， 
要 么 是 单独 的 项 。 如 果 将 这 些 概 念 融 为 一 体 , 那么 该 产生 式 是 说 ， 每 个 表达 式 都 是 项 后 面 跟 上 0 
个 或 更 多 由 一 个 + 或 -以 及 一 项 构成 的 配对 。 同 样 ， 第 (2) 行 表示 项 是 由 较 小 的 项 后 面 跟 上 * 或 /以 
及 因 式 构成 的 。 也 就 是 说 , 项 是 由 因 式 后 面 跟 上 0 个 或 更 多 由 一 个 * 或 /加 上 一 个 因 式 组 成 的 配对 。 
第 (3) 行 说 的 是 因 式 或 者 是 数字 , 或 者 是 由 括号 包 轩 的 表达 式 。 而 第 (4) 行 和 第 (5) 行 则 像 之 前 所 做 
的 那样 定义 了 数字 和 数码 。 

之 所 以 在 第 (1) 行 和 第 (2) 行 中 使 用 了 诸如 

<E>— <E>+<7> 

这 样 的 产生 式 ， 而 没有 使 用 看 似 与 之 等 价 的 <E>-><7>+<E>， 就 是 为 了 强制 这 些 项 从 
左 起 分 组 , 因此 , 我 们 看 到 像 1-2+3 这 样 的 表达 式 会 被 正确 地 分 组 为 (1-2)+3。 同样 , 像 1/2*3 
这 样 的 项 也 能 被 正确 地 分 组 为 (1/2)*3。 图 11-23 展 示 了 用 图 11-22 中 的 文法 表示 表达 式 1-2+3 
的 唯一 分 析 树 。 请 注意 ,1-2 必须 首先 被 组 合 为 表达 式 。 如 果 像 图 11-20b 中 那样 先 组 成 2+3， 是 
没 办 法 用 图 11-22 所 示 的 文法 将 1- 附 加 到 该 表达 式 上 的 。 

表达 式 、 项 和 因 式 之 间 的 区 别 使 得 处 于 不 同 优先 级 的 运算 符 能 被 正确 分 组 。 例 如 ， 表 达 式 
1+2*3 对 应 的 分 析 树 只 有 图 11-24 所 示 的 那 棵 ， 它 像 图 11-21b 所 示 的 树 那 样 先 组 合 了 子 表 达 式 
2*3， 而 不 是 像 图 11-21a 所 示 的 错误 的 树 那 样 首先 组 合 1+2。 

就 像 之 前 提 到 的 平衡 括号 串 问题 那样 ,我 们 没有 证 明 图 11-22 所 示 的 文法 是 无 二 义 的 。 习题 
中 包含 了 更 多 例子 ， 应 该 有 助 于 说 服 读者 相信 该 文法 不 仅 是 无 二 义 的， 而且 为 各 个 表达 式 给 出 
了 正确 的 组 合 方式 。 我 们 还 表述 了 该 文法 的 思路 如 何 扩展 到 更 全 面 的 表达 式 家 族 。 
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<E> 一 二 
<T> <F> <N> 
<F> <N> <DS 

| | | 
<N> <D> 3 
<D> 2 





<F> <F> <N> 
el | 
<N> <N> <D> 
| | | 
<D> <D> 3 
| 
1 2 


图 11-24 ”用 图 11-22 中 的 无 二 义 文法 表示 表达 式 1+2*3 的 分 析 树 


11.5.3 ”习题 
(1) 用 图 11-22 所 示 的 文法 ， 为 下 列 各 表达 式 给 出 唯一 的 分 析 树 。 
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(a) (1+2)/3 
(b) 1*2-3 
(c) (1+2)* (3+4) 

(2) * 图 11-22 所 示 文 法 的 表达 式 有 两 级 优先 级 ，+ 和 -在 第 一 级 ， 而 * 和 /在 更 高 的 第 二 级 。 一 般 而 言 ， 
我 们 可 以 利用 导 1 个 语法 分 类 处 理 具有 K 个 优先 级 的 表达 式 。 修 改 图 11-22 中 的 文法 ,使 其 包含 乘 方 
运算 符 ^， 它 的 优先 级 比 * 和 /更 高 。 作 为 提示 ， 大 家 要 定义 是 操作 数 或 带 括号 表达 式 的 要 素 ， 并 重 
新 把 因 式 定义 为 一 个 或 多 个 要 素 由 乘 方 运算 符 连 接 而 成 。 请 注意 ， 乘 方 的 组 合 是 从 右 起 而 不 是 从 
左 起 的 ， 也 就 是 说 ，2^3^4 表 示 的 是 2^ (3^4) ， 而 不 是 (2^3)^4。 我 们 该 如 何 确保 在 要 素 中 是 从 
右 起 进行 组 合 的 ? 

(3) * 扩展 该 无 二 义 表达 式 文 法 ， 人 允许 =、<= 等 比较 运算 符 ， 这 些 比较 运算 符 都 具有 同样 的 优先 级 而 
且 是 左 关联 的 ， 它 们 的 优先 级 在 + 和 -之 下 。 

(4) 扩展 图 11-22 中 的 表达 式 文法 , 使 其 包含 一 元 减 号 。 请 注意 ,这 一 运算 符 的 优先 级 要 比 其 他 运算 符 
的 优先 级 更 高 ， 例 如 ，-2*-3 就 被 组 合 为 (-2)* (-3)。 

(5) 扩展 习题 (3) 中 得 出 的 文法 , 已 包含 逻辑 运算 符 &g&、| | 和 5!。 其 中 && 和 * 有 着 相同 优先 级 ， 而 
| | 的 优先 级 与 + 相同 ， 而 ! 的 优先 级 则 比 一 元 的 -更 高 。&& 和 | | 这 两 个 二 元 运算 符 都 是 从 左 起 
组 合 的 。 

(6) * 不 是 每 个 表达 式 按 照 11.2 节 图 11-2 所 示 的 二 义 性 文法 都 有 一 棵 以 上 的 分 析 树 。 给 出 一 些 根据 
该 文法 只 有 唯一 分 析 树 的 表达 式 。 大 家 能 否 给 出 一 条 规则 , 说 明 什 么 时 候 表达 式 会 具有 唯一 的 
分 析 树 ? 

(7) 以 下 文法 定义 了 只 有 0 和 1 组 成 的 字符 串 的 集合 (不 含 c ) 。 

< 字符 串 > 一 < 字符 串 > < 字符 串 >1011 
在 该 文法 中 ,字符 串 010 有 几 棵 分 析 树 ? 

(8) 给 出 与 习题 (7) 中 文法 具有 相同 语言 的 无 二 义 文法 。 

(9) * 文法 (11.1) 对 空 串 来 说 有 多 少 分 析 树 ?给 出 对 应 空 串 的 3 种 不 同 的 分 析 树 。 


11.6 分 析 树 的 构造 


文法 和 正则 表达 式 一 样 ， 都 可 以 描述 语言 ， 但 都 不 能 直接 给 出 算法 来 确定 某 字符 串 是 否 在 
所 定义 的 语言 中 。 对 正则 表达 式 来 说 ， 我 们 在 第 10 章 中 已 经 了 解 到 如 何 先 把 正则 表达 式 转换 成 
非 确定 自动 机 ， 接 着 转换 成 确定 自动 机 ， 而 这 一 确定 自动 机 就 可 以 直接 实现 为 程序 。 

对 文法 来 说 ， 也 存在 多 少 有 些 相似 的 处 理 过 程 。 一 般 来 说 ， 根 本 不 可 能 把 文法 转换 成 确定 
自动 机 ， 在 11.7 节 中 我 们 会 讨论 一 些 可 以 进行 这 种 转换 的 例子 。 不 过 ， 通 常 可 以 把 文法 转换 成 
类 似 自 动机 的 程序 ， 从 头 至 尾 读 取 输 入 ， 并 呈现 该 输入 字符 串 是 否 在 该 文法 的 语言 中 的 决策 。 
这 类 技术 中 最 重要 的 就 是 “LR 分 析 ”( LR 代表 从 左 至 右 扫 描 输 入 ), 但 它 不 在 本 书 要 讨论 的 范围 
之 内 。 

11.6.1 递归 下 降 分 析 


这 里 要 介绍 的 是 一 种 更 加 人 简单 但 不 那么 强大 的 分 析 技 术 一 一 “递归 下 降 分 析 ”, 在 这 种 分 析 
中 ， 文 法 会 被 一 系列 相互 递归 的 函数 兰 代 ， 每 个 递归 函数 都 对 应 文法 中 的 一 个 语法 分 类 。 对 应 
语法 分 类 <5> 的 函数 S$ 的 目标 是 恋人 构成 语言 (<5>) 中 字符 串 的 字符 序列 ， 并 返回 指向 该 字符 串 
分 析 树 根 证 点 的 指针 。 

产生 式 的 右 部 可 以 看 作 找 到 左 部 的 语法 分 类 中 的 字符 串 所 必须 满足 的 一 系列 目标 一 一 终结 
符 和 语法 分 类 。 例 如 ， 考 虑 表示 平衡 括号 串 的 无 二 义 文法 ,我 们 在 图 11-25 中 将 其 重 现 。 
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(1) <B> 一 上 
(2) <B> — (<B> ) <B> 





图 11-25 ”表示 平衡 括号 串 的 文法 


产生 式 (2) 表 述 了 弄 清平 衡 括 号 串 是 否 依次 满足 以 下 4 个 条 件 的 一 种 方法 。 

(1) 找到 字符 (; 

(2) 然后 找到 平衡 括号 串 ; 

(3) 然后 找到 字符 ) ; 

(4) 最 后 找到 另 一 个 平衡 括号 串 。 

般 而 言 ， 如 果 发 现 某 终结 符 是 下 一 个 输入 符号 ， 终 结 符 的 目标 就 得 到 满足 了 ， 但 如 果 下 

一 个 输入 符号 是 其 他 内 容 , 这 一 目标 就 不 会 被 满足 了 。 要 弄 清 右 部 中 的 语法 分 类 是 否 得 到 满足 ， 
可 以 调用 对 应 该 语法 分 类 的 函数 。 

根据 文法 构建 分 析 树 的 安排 如 图 11-26 所 示 。 假 设 要 确定 某 终 结 符 序列 XXX,…X, 是 否 为 语 
法 分 类 <5> 中 的 字符 串 ， 而 且 如 果 是 还 要 给 出 它 的 分 析 树 。 然 后 我 们 在 输入 文件 中 放 入 
XIX,… 了 XY, ENDM, 其 中 ENDM 是 一 个 不 属于 终结 符 的 特殊 符号 。 "ENDM 叫 作 端 记号 ( endmarker )， 
它 的 作用 是 表示 待 检查 的 整个 字符 串 已 经 被 恋人 了 。 例 如， 在 C 语 言 程序 中 ， 通 常会 使 用 EOF 
或 EOS 字 符 作为 端 记号 。 




















从 1 XX， An ENDM 





图 11-26 初始 化 在 输入 中 发 现 <S> 的 程序 


输入 游标 input cursor ) 标记 了 要 被 处 理 的 终结 符 ， 也 就 是 当前 的 终结 符 。 如 果 输 入 是 字 
符 串 ， 那 么 游标 可 以 是 指向 字符 的 指针 。 分 析 程序 首先 要 调用 对 用 语法 分 类 <S> 的 函数 S， 而 且 
输入 游标 是 在 输入 的 开头 位 置 。 

每 当 处 理 产生 式 右 部 ， 并 在 产生 式 中 遇 到 终结 符 a 的 时 候 ， 就 要 在 输入 游标 指示 的 位 置 查 
找 相 匹配 的 终结 符 a。 如 果 找到 a， 就 把 输入 游标 移 至 输入 中 的 下 一 个 终结 符 。 如 果 当 前 的 终结 
符 是 a 之 外 的 内 容 ， 就 是 匹配 失败 ， 就 不 能 为 该 输入 字 答 串 给 出 分 析 树 。 

另 一 方面 ， 如 果 处 理 产 生 式 右 部 并 遇 到 了 语法 分 类 <7T>， 就 要 调用 与 <7> 对 应 的 函数 7。 
如 果 7 “失败 "， 那 么 整个 分 析 也 失败 ， 而 该 输入 就 被 视 为 不 在 待 分 析 的 语言 中 。 如 果 7 成 功 ， 
它 就 会 “消灭 ” 某 一 输入 ， 把 输入 游标 向 前 移动 对 应 该 输入 的 0 个 或 更 多 位 置 。 从 7 被 调用 时 
的 位 置 直到 7 离开 游标 之 前 的 位 置 都 要 被 销毁 。7 还 会 返回 一 棵 树 ， 就 是 与 该 被 销毁 输入 对 应 
的 分 析 树 。 

当 我 们 处 理 完 产生 式 右 部 中 的 各 个 符号 后 ,就 要 为 该 产生 式 表 示 的 那 部 分 输入 生成 分 析 树 。 
要 完成 这 一 工作 ， 就 需要 创建 一 个 新 的 根 节点 ， 并 以 该 产生 式 的 左 部 作为 其 标号 。 该 根 节点 的 
子 节点 是 成 功 调用 与 右 部 中 语法 分 类 对 应 的 函数 所 返回 的 树 的 根 节点 ， 而 且 要 为 右 部 中 的 每 个 
终结 符 创建 相应 的 叶子 节点 。 











Q 在 实际 用 于 编程 语言 的 编译 需 中 ， 整 个 输入 可 能 不 是 一 次 性 放 和 一 个 文件 中 的 ， 而 是 由 每 次 检查 源 程序 中 一 个 
字符 的 “词法 分 析 吾 ”这 种 预 处 理 融 一 次 找到 一 个 终结 符 。 
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11.6.2 ”用 于 平衡 括号 串 的 递归 下 降 分 析 器 

现在 来 考虑 一 个 扩展 过 的 例子 ， 看 看 如 何 为 图 11-25 所 示 文 法 中 的 语法 分 类 <B> 设 计 递归 也 
数 B。 在 某 个 输入 位 置 被 调用 的 函数 丸 ， 会 销毁 从 那个 位 置 开 始 的 某 个 平衡 括号 串 ， 并 把 输入 光 
标 留 在 紧 临 该 平衡 括号 串 之 后 的 那个 位 置 。 

难点 在 于 ， 要 满足 确定 <B> 这 一 目标 ， 到 底 是 使 用 可 以 立即 成 功 的 产生 式 (1)，<B> 一 e ， 
还 是 使 用 产生 式 (2), 也 就 是 <B> 一 (<B>) <B>。 而 我 们 要 遵循 的 策略 是 ， 只 要 下 一 个 终结 符 为 (， 
就 使 用 产生 式 (2)， 只 要 下 一 个 终结 符 是 ) 或 是 端 记号 ， 就 使 用 产生 式 (1)。 

函数 B 如 图 11-27b 所 示 ， 在 它 之 前 的 图 11-27a 中 是 一 些 重 要 的 辅助 要 素 ， 这 些 元 素 包 括 以 下 
几 点 。 

(1) 常量 FAILED 被 定义 为 函数 B 没 能 在 输入 中 找到 平衡 括号 串 时 的 返回 值 。FAILED 的 值 与 
NULL 相 同 。 后 者 的 值 也 表示 一 棵 空 树 。 不 过 ， 如 果 B 成 功 的 话 ， 它 返回 的 分 析 树 不 会 为 空 ， 所 
以 FAILED 的 这 一 定义 是 不 可 能 有 二 义 性 的 。 

(2) 类 型 NODE 和 TREE 的 定义 。 节 点 是 由 标号 字段 (字符 )， 以 及 指向 最 左 子 节点 和 右 见 弟 
节点 的 指针 组 成 的 。 标 号 吕 ? 表 示 标 号 为 B 的 节点 ,“(' 和 ?7 分别 表示 标号 为 左 括号 和 右 括号 的 节 
点 ， 而 'e’ 则 表示 标号 为 e 的 节点 。 与 5.3 节 中 最 左 子 节点 右 见 第 节点 结构 不 同 的 是 ,这 里 为 指 回 
节点 的 指针 选择 的 类 型 是 TREE 而 非 pPNODE， 因 为 这 里 的 这 些 指针 多 用 来 作为 树 的 表示 。 

(3) 下 面 要 描述 的 3 个 辅助 郴 数 和 函数 8 的 原型 声明 。 

(4) 两 个 全 局 变量 。 第 一 个 是 parseTree, 存放 着 由 对 8B 的 第 一 次 调用 返回 的 分 析 树 。 第 二 
个 是 nextTerminal ,， 它 是 输入 游标 ， 指 问 输入 终结 符 串 中 的 当前 位 置 。 请 注意 ， 
nextTerminal 具 有 全 局 性 是 很 重要 的 ， 这 样 当 B 的 一 次 调用 返回 时 ， 输 入 游标 所 在 的 位 置 对 
执行 这 次 调用 的 B 的 副本 而 言 就 是 已 知 的 。 

(5) main 国 数 。 在 这 一 简单 的 演示 中 ，main 将 nextTerminal 置 为 指向 特定 测试 串 () () 
开头 的 位 置 ， 而 且 调 用 B 的 解雇 被 放置 在 parseTree 中 。 

(6) 3 个 辅助 函数 可 以 创建 树 节 点 ， 而 且 ， 如 果 需 要 的 话 ， 可 以 组 合子 树 以 形成 更 大 的 树 。 
它们 分 别 是 

(a) makeNode0(x) 函 数 创建 的 节点 没有 子 节 点 , 也 就 是 说 , 它 创 建 的 是 叶子 节点 , 而 且 用 
符号 x 作 为 该 叶子 节点 的 标号 。 返 回 的 是 由 这 一 个 节点 组 成 的 树 。 

(b) makeNodel(x, 四 困 数 创建 的 节点 具有 一 个 子 节 点 。 新 节点 的 标号 为 x， 而 且 其 子 节点 
是 树 : 的 根 节 点 。 返 回 的 是 根 节 点 为 所 创建 节点 的 树 。 请 注意 ，makeNode1 要 利用 
makeNode0 创 建 根 节 点 , 然后 让 树 的 根 节 点 成 为 所 创建 根 节 点 的 最 左 子 节 点 。 我 们 
假设 所 有 的 最 左 子 市 点 和 右 兄 弟 市 点 指针 一 开始 都 是 NULL， 而 且 它 们 就 是 ， 因 为 它 
们 都 是 由 makeNode0 创 建 的， 该 函数 显然 将 它们 置 为 了 NULL。 因 此 ，makeNodel 
并 不 一 定 要 把 NULL 存 储 到 树 ! 根 节点 的 zightSibling 字 段 中 ， 不 过 这 样 做 是 明智 
的 安全 之 休 。 

(c) 函数 makeNode4(x, 41, b, &, 区 创建 的 节点 具有 4 个 子 节点 。 该 节点 的 标号 是 xz， 而 其 子 
节点 按照 从 左 到 右 的 次 序 分 别 是 树 、t、&6 和 4 的 根 节点 ,返回 的 是 用 所 创建 节点 作 
为 根 节 点 的 树 。 请 注意 ，makeNode4 要 利用 makeNode1 创 建 一 个 新 的 根 节 点 ， 并 将 
附加 到 该 节点 上 ， 然 后 用 右 兄弟 市 点 指针 把 其 余 的 树 串 联 起 来 。 
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#define FAILED NULL 


typedef struct NODE *TREE,; 
struct NODE 1 

char label; 

TREE leftmostChild, rightSibling,; 
} 


TREE makeNode0(char x); 

TREE makeNode1(char x, TREE 七 ) ; 

TREE makeNode4(char x, TREE ti, TREE t2, TREE t3, TREE t4) ; 
TREE B() ; 


TREE parseTree; /* 存放 分 析 的 结果 */ 
char *nextTerminal; /* 输入 字符 串 中 的 当前 位 置 */ 


void main(l) 


{ 
nextTerminal = "()()"; /* 在 实际 应 用 中 ,终结 符 事 是 从 输入 读 取 的 */ 
parseTree = B(); 
} 
TREE makeNodeO (char x) 
{ 
TREE root,; 
root = (TREE) malloc (sizeof (struct NODE) ) ; 
root->label] = xX; 
root->leftmostChild = NULL ; 
root->rightSibling = NULL; 
return root; 
} 
TREE makeNodeli(char x, TREE t) 
{ 
TREE root,; 
root = makeNodeO0 (x); 
root->leftmostChild = t; 
return root ; 
} 


TREE makeNode4(char x, TREE ti1, TREE t2, TREE t3, TREE t4) 


{ 
TREE root,; 


root = makeNodel(x, t1); 
t1i->rightSibling = t2; 
t2->rightSibling = t3; 
t3->rightSibling = t4; 
return root,; 





图 11-27(a) 递归 下 降 分 析 器 的 辅助 函数 
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TREE B() 
二 


卢 : 


re 
ODO 
— 


TREE firstB, secondP; 


if(x*nextTerminal == ，”(”) /* 遵循 产生 式 2 */ { 
nextTerminal++; 
tiretB = B(): 
if (firstB != FAILED && +*+nextTerminal == ’)’) +{ 
nextTerminal+tt+t; 
secondB = B(); 
if(secondB == FAILED) 
return FAILED; 
else 


OO 





(10) return makeNode4(’B’, 
makeNode0(’(’), 
firstB, 
makeNode0(’)’), 
secondB); 

} 
else /* 对 B 的 第 一 次 调用 失败 了 */ 
(11) return FAILED; 
} 
else /* 遵循 产生 式 1 */ 
(12) return makeNode1(’B’, makeNode0(’e’)); 
} 








图 11-27(b) 为 平衡 括号 串 构 建 分 析 树 的 函数 


现在 可 以 一 行 行 考虑 图 11-27b 所 示 的 程序 了 。 第 (1) 行 是 两 个 局 部 变量 firstB 和 secondB 
的 声明 ， 这 两 个 局 部 变量 的 作用 是 存放 在 尝试 产生 式 (2) 的 情况 下 对 8B 的 两 次 调用 所 返回 的 分 析 
树 。 第 (2) 行 会 测试 输入 的 下 一 个 终结 符 是 否 为 (。 如 果 是 ,我 们 就 将 在 产生 式 (2) 的 右 部 中 查找 
实例 ， 如 果 不 是 ， 就 要 假设 使 用 的 是 产生 式 (1)， 而 且 e 就 是 该 平衡 串 。 

在 第 (3) 行 ， 我们 要 递增 nextTerminal， 因 为 当前 输入 (已 经 匹配 上 了 产生 式 (2) 右 部 中 的 
(。 我 们 现在 已 经 让 输入 游标 处 在 恰当 的 位 置 , 它 对 应 的 对 8B 的 调用 将 为 产生 式 (2) 右 部 中 的 第 一 
个 <B> 找 到 平衡 串 。 对 B 的 这 次 调用 是 在 第 (4) 行 发 生 的 ， 而 该 调用 返回 的 树 被 存储 在 变量 
firstB 中 ， 它 随后 会 被 装配 成 与 当前 对 B 的 调用 对 应 的 分 析 树 。 

第 (5) 行 要 检查 是 否 仍然 有 能 力 找 到 平衡 串 。 也 就 是 说 ， 首 先 要 确定 第 (4) 行 对 B 的 调用 没有 
失败 。 然 后 测试 nextTerminal 当 前 的 值 是 否 为 ) 。 回 想 一 下 ， 当 B 返 回 时 ,nextTerminal 
指向 要 用 来 形成 平衡 串 的 下 一 个 输入 终结 符 。 如 果 要 匹配 产生 式 (2) 的 右 部 , 而 且 已 经 匹配 了 (与 
第 一 个 <B>, 那么 就 必须 匹配 ) , 这 就 解释 了 该 测试 的 第 二 部 分 。 只 要 该 测试 的 任何 一 部 分 失败 ， 
当前 对 B 的 调用 就 会 在 第 (11) 行 失败 。 

若 通 过 了 第 (5) 行 的 测试 , 则 在 第 (6) 和 第 (7) 行 要 把 输入 游标 移 过 刚 发 现 的 右 括 号 , 并 再 次 调 
用 B， 以 匹配 产生 式 (2) 中 的 最 后 一 个 <B>。 返 回 的 树 被 临时 存储 在 secondB 中 。 

如 果 第 (7) 行 对 B 的 调用 失败 ，secondB 的 值 就 会 是 FAILED。 第 (8) 行 会 检测 这 种 情况 ， 而 
且 当 前 对 B 的 调用 也 会 失败 。 

第 (10) 行 代表 的 是 成 功 找到 平衡 括号 串 的 情况 。 我 们 要 返回 由 makeNode4 构 建 的 树 。 该 
树 具 有 标号 为 ”Ba 的 根 节 点 以 及 4 个 孩子 。 第 一 个 是 标号 为 (的 叶子 节点 ， 它 是 由 makeNode0 
构造 的 。 第 二 个 是 存储 在 fijrstB 中 的 树 ， 它 是 通过 第 (4) 行 对 B 的 调用 产生 的 分 析 树 。 第 三 个 




















502 第 1l1 章 模式 的 递归 描述 





是 标号 为 ) 的 叶子 市 点 ， 第 四 个 则 是 由 第 (7) 行 对 8B 的 第 二 次 调用 返回 的 分 析 树 ， 它 存储 在 
secondB 中 。 

只 有 在 第 (5) 行 的 测试 失败 时 ， 才 会 使 用 第 (11) 行 。 第 (12) 行 处 理 的 是 第 (1) 行 的 初始 测试 没 
能 在 第 一 个 字符 的 位 置 找到 (的 情况 。 在 这 种 情况 下 ,假设 产生 式 (1) 是 正确 的 。 该 产生 式 的 右 
部 为 e ， 因 此 我 们 没有 销毁 任 何 输 入 ,但 返回 了 一 个 由 makeNode1 创 建 的 节点 ， 其 标号 为 B 而 
且 有 一 个 标号 为 e 的 子 节点 。 


+ 示例 11.9 

假设 在 输入 中 有 终结 符 串 () () ENDM。 这 里 的 ENDM 代 表 字 符 '\0', 它 是 在 C 语 言 中 用 来 标 
记 字 符 串 结尾 的 。 图 11-27a 中 main 函 数 对 B 的 调用 确定 了 (是 当前 的 输入 , 而 且 第 (2) 行 的 测试 会 
成 功 。 因 此 ，nextTerminal 在 第 (3) 行 会 前 移 ， 而且 第 (4) 行 会 进行 对 B 的 第 二 次 调用 ， 表 示 为 图 
11-28 中 的 “调用 2”。 





( ) ( ) ENDM 


调用 4 ”调用 5 








图 11-28 ”在 处 理 输 入 () () ENDM 时 进行 的 调用 


在 调用 2 中 ， 第 (2) 行 的 测试 失败 ， 因 此 在 第 (12) 行 会 返回 图 11-29a 所 示 的 树 。 现 在 回 到 调用 
1， 其 中 在 第 (5) 行 时 ，nextTerminal 指 问 的 是 ) ， 而 且 图 11-29a 的 树 在 fijrstB 中 。 因 此 ， 第 
(5) 行 的 测试 会 成 功 。 我 们 在 第 (6) 行 前 移 nextTerminal, 并 在 第 (7) 行 调用 B。 这 是 图 11-28 中 所 
示 的 “调用 3”。 

在 调用 3 中 ， 我 们 在 第 (2) 行 成 功 ， 在 第 (3) 行 前 移 nextTerminal， 并 在 第 (4) 行 调用 B， 该 
调用 就 是 图 11-28 中 的 “调用 4”。 就 和 调用 2 一 样 ， 调 用 4 也 会 在 第 (2) 行 的 测试 失败 ， 并 在 第 (12) 
行 返 回 一 棵 类 似 图 11-29a 的 树 但 有 所 不 同 。 

我 们 现在 回 到 了 调用 3, 其 中 nextTerminal 仍 然 指 问 ) ,， firstB (是 此 次 对 8B 的 调用 的 局 
部 变量 ) 存放 着 一 棵 类 似 图 11-29a 这 样 的 树 ， 而 且 有 着 第 (5) 行 的 控制 。 这 次 测试 会 成 功 ， 而 且 
我 们 会 在 第 (6) 行 前 移 nextTerminal, 所 以 它 现在 指向 的 是 ENDM。 我 们 在 第 (7) 行 进行 对 B 的 第 
五 次 调用 。 该 调用 在 第 (2) 行 的 测试 会 失败 ,并 在 第 (12) 行 返回 图 11-29a 的 男 一 个 副本 。 这 棵 树 称 
为 对 应 调用 3 的 secondB 的 值 ， 并 且 第 (8) 行 的 测试 也 失败 了 。 因 此 ， 在 调用 3 的 第 (10) 行 ， 我们 
要 构建 如 图 11-29b 所 示 的 树 。 

至 此 ,调用 3 在 第 (8) 行 成 功 地 返回 到 调用 1， 这 时 调用 1 的 secongB 存 放 着 图 11-29b 中 的 树 。 
就 像 在 调用 3 中 那样 , 第 (8) 行 的 测试 会 失败 ,而且 我 们 在 第 (10) 行 要 构建 一 棵 有 着 新 根 节点 的 树 ， 
其 第 二 个 孩子 是 图 11-29a 所 示 树 的 一 个 副本 ( 这 棵 树 被 存放 在 调用 1 的 fijrstB 中 ), 而 且 它 的 第 
四 个 孩子 是 图 11-29b 中 的 树 。 得 到 的 树 被 main 函 数 放置 在 parseTree 中 , 它 的 样子 如 图 11-29c 
所 示 。 
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B B 
同 攻 过 
" | | 
B 
A 
| I~ 


(c) 
图 11-29 ”由 对 8B 的 递归 调用 构建 的 树 


11.6.3 ”递归 下 降 分 析 器 的 构建 


虽然 不 能 针对 所 有 文法 , 但 可 以 将 图 11-27 中 用 到 的 技术 扩展 到 适用 于 很 多 文法 。 关 键 要 求 
是 ， 对 各 语法 分 类 <S>， 如 果 存 在 不 止 一 个 以 <5> 为 左 部 的 产生 式 ， 那 么 通过 查看 当前 唯一 的 终 
结 符 ( 通常 被 称 为 前 瞻 符 号 )， 就 可 以 确定 那个 需要 得 到 尝试 的 以 <S> 为 左 部 的 产生 式 。 例 如 ， 
在 图 11-27 中 ,我 们 的 决策 就 是 ， 只 要 前 瞻 符 号 是 (， 就 选取 右 部 为 (<B>) <B> 第 二 个 产生 式 ， 而 
要 是 前 瞻 符 号 为 ) 或 ENDM， 就 选 定 右 部 为 e 的 第 一 个 表达 式 。 

一 般 来 说 ， 我 们 不 可 能 弄 清 对 某 定 义 文法 而 言 是 否 存在 总 能 做 出 正确 决定 的 算法 。 对 图 
11-27 来 说 ,我 们 声明 所 陈述 的 策略 是 行 得 通 的 , 但 并 未 对 此 加 以 证 明 。 不 过 ， 如 果 拥 有 自己 相 
信行 得 通 的 决策 ， 那 么 就 可 以 按照 如 下 方式 为 各 语法 分 类 <S> 设 计 函 数 5。 

(1) 检查 前 脆 符 号 ， 并 决定 要 尝试 哪个 产生 式 。 假 设 被 选中 的 产生 式 右 部 为 人 YX,… 了 X，。 

(2) 对 i = 1、2、…、n， 为 了 * 进 行 以 下 操作 。 

(a) 如 果 素 是 终结 符 ， 检 查 前 脆 符 号 是 否 为 和 。 如 果 是 ， 则 前 移 输 入 游标 。 如 有 果 不 是 ， 那 
么 这 次 对 5 的 调用 就 失败 了 。 

(b) 如 果 铸 是 语法 分 类 ， 比 方 说 是 <7>， 就 调用 对 应 该 语法 分 类 的 函数 T。 如果 7T 以 失败 状 
态 返 回 ， 就 说 明 对 8 的 调用 失败 了 。 如 果 7 成 功 返 回 ， 就 把 返回 的 树 存储 起 来 以 待 随 
后 使 用 。 

如 果 在 考虑 完 所 有 的 之 后 都 没有 失败 ， 就 创建 各 孩子 按 次 序 分 别 对 应 矶 、 系 成 的 新 
节点 ， 以 组 成 一 棵 要 返回 的 分 析 树 。 如 果 和 是 终结 符 , 那么 和 的 孩子 就 是 新 创建 的 以 和 为 标号 的 
叶子 节点 。 如 果 天 是 语法 分 类 ， 那么 丈 的 子 节 点 就 是 在 与 入 对 应 的 函数 完成 调用 时 返回 的 树 的 根 
节点 。 图 11-29 就 是 这 种 树 构 建 过 程 的 示例 。 

如 果 语 法 分 类 <S> 表 示 所 含 字符 串 有 竺 识别 和 分 析 的 语言 ， 就 要 在 第 一 个 输入 的 终结 符 处 
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放置 输入 游标 ,开始 分 析 过 程 。 如 果 输 入 在 语言 L(<5>) 中 ， 对 函数 S$ 的 调用 就 会 使 得 对 应 该 输入 
的 分 析 树 被 构建 起 来 ， 而 如 果 不 在 的 话 ， 对 5$ 的 调用 就 会 返回 失败 。 


11.6.4 “习题 
(1) 给 出 针对 以 下 输入 ， 图 11-27 所 示 的 程序 所 执行 的 调用 序列 ， 其 中 每 种 情况 下 最 后 都 跟着 端 记 号 


Ah 上 


ENDM 付 -地 。 
(a) (()) 
(b) (() ()) 
(c) ())( 
(2) 考虑 以 下 表示 数字 的 文法 。 
< 数字 > 一 < 数码 > < 数字 > | e 
< 数码 > 一 0|11|…|9 
设计 对 应 该 文法 的 递归 下 降 分 析 器 ， 也 就 是 说 ， 编 写 两 个 函数 ， 其 中 一 个 对 应 < 数字 >， 另 一 个 对 
应 < 数码 >。 大 家 可 以 遵照 图 11-27 中 的 格式 ， 并 假设 存在 makeNode1 这 种 根 节 点 具有 指定 数目 子 
节点 的 树 。 
(3) ** 假设 把 习题 2) 中 对 应 < 数字 > 的 生成 式 写 为 
< 数字 > 一 < 数码 > < 数字 > | < 数码 > 
或 
< 数字 > 一 < 数字 > < 数码 > | e 
是 否 还 能 够 设计 递归 下 降 分 析 右 ?为 什么 ? 





<L> (EAT 
<I > = <E><IS 


<E> 一 <L> 
< 上 > 一 原子 


(1) 
(2) 
(3)” <7 =7) 
(4) 
(5) 





图 11-30 对 应 表 结 构 的 文法 
(4)* 图 11-30 所 示 的 文法 定义 了 非 空 表 ， 表 的 元 素 是 由 逗号 分 隔 并 由 括号 包 半 的 。 元 素 可 以 是 原子 或 
表 结 构 体 。 在 这 里 ， <> 代表 元 素 ，<I> 表 示 表 ,而 <7> 则 对 应 “尾部 ”, 也 就 是 ,要 么 是 闭合 的 ) ， 
要 么 是 由 逗号 和 以 ) 结尾 的 元 素 构成 的 配对 。 为 图 11-30 中 的 文法 编写 递归 下 降 分 析 需 。 


11.7 表 驱 动 分 析 算 法 


正如 我 们 在 6.7 节 中 看 到 过 的 , 递归 函数 调用 通常 是 用 活动 记录 栈 实现 的 。 因 为 递归 下 降 分 
析 右 中 的 函数 完成 的 工作 非常 具体 ， 所 以 可 以 用 一 个 检查 表 并 操作 栈 的 函数 来 代 禁 这 些 函 数 。 
要 记得 ， 对 应 语法 分 类 <5> 的 函数 S$ 首先 要 决定 使 用 哪个 产生 式 ， 然 后 经 过 一 系列 步 妊 ,每 
个 步骤 都 对 应 着 所 选 产 生 式 右 部 中 的 一 个 符号 。 因 此 ， 可 以 维持 一 个 大 致 与 活动 记录 栈 对 应 的 
文法 符号 栈 ， 而 符号 和 语法 分 类 都 被 放置 在 该 栈 中 。 当 语法 分 类 <S> 位 于 栈 顶 时 ， 首 先 要 确定 
正确 的 产生 式 。 然 后 用 所 选 产 生 式 的 右 部 替换 <S>， 其 中 右 部 的 左 端 位 于 栈 项 。 如 果 是 终结 符 
位 于 栈 顶 ， 就 要 确定 它 是 否 与 当前 输入 符号 匹配 。 如 果 是 , 我们 就 将 其 弹出 栈 并 前 移 输入 游标 。 
要 从 直觉 上 了 解 这 种 安排 为 何 起 作用 ， 先 假设 递归 下 降 分 析 需 刚 调用 过 对 应 语法 分 类 <9S> 
的 函数 S$， 而 且 选 定 的 产生 式 右 部 为 a<B ><C >。 那 么 对 应 S$ 的 这 一 活动 记录 会 在 以 下 4 个 时 候 
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处 于 活动 状态 。 

(1) 在 检验 a 是 否 在 输入 中 时 ; 

(2) 在 进行 对 B 的 调用 时 ; 

(3) 在 该 调用 返回 而 且 C 被 调用 时 ; 

(4) 在 对 C 的 调用 返回 而 且 S 完 成 调用 时 。 

如 果 我 们 在 表 驱 动 分 析 咒 中 直接 用 右 部 的 符号 ( 本 例 中 是 a<B><C> ) 替换 <S>,， 那么 该 
活动 记录 栈 会 在 控制 权 返 回 对 应 递归 下 降 分 析 器 中 的 活动 时 的 输入 位 置 曝光 这 些 符号 。 

(1) 第 一 次 曝光 的 是 a， 而 且 我 们 会 检测 a 是 否 在 输入 中 ， 就 像 函 数 S 所 做 的 那样 。 

(2) 第 二 次 ， 紧 接 第 一 次 之 后 发 生 ，5S 会 调用 ， 而 <B> 会 位 于 栈 顶 ， 这 会 造成 相同 的 行为 。 

(3) 第 三 次 ，$ 调 用 C， 不 过 这 里 是 <C> 在 栈 项 ， 而 且 完 成 的 是 相同 的 工作 。 

(4) 第 四 次 ，S$ 返 回 ， 而 且 我 们 不 会 发 现 更 多 替代 <S> 的 符号 。 因 此 , 活动 记录 栈 中 此 点 以 下 
的 符号 之 前 存放 在 <S> 中 ,但 现在 被 暴露 在 外 了 。 类 似 地 ， 在 5S 的 活动 记录 以 下 的 活动 记录 在 递 
归 下 降 分 析 需 中 会 得 到 控制 权 。 


11.7.1 分析 表 


如 果 不 想 写 一 系列 的 递归 函数 ， 也 可 以 构建 分 析 表 ( parsing table )， 它 的 每 一 行 都 对 应 着 
语法 分 类 ， 每 一 列 对 应 着 可 能 的 前 瞻 符 号 。 在 表示 语法 分 类 <S> 的 那 一 行 中 ， 对 应 前 瞻 符 号 X 的 
项 是 前 瞻 符 号 为 ZX 时 展开 <S> 必 须 用 到 的 以 <S> 为 左 部 的 产生 式 的 编号 。 

分 析 表 中 的 某 些 项 可 能 为 空 。 假 设 需要 展开 的 语法 分 类 <S> ， 而 且 前 瞻 符 号 为 XY， 但 我 们 发 
现 表 示 <S> 的 那 行 中 对 应 2 的 那 一 项 为 空 ， 就 说 明 分 析 已 经 失败 了 。 这 种 情况 下 ， 可 以 确定 该 输 
入 不 在 此 语言 中 。 


+ 示例 11.10 

图 11-31 表 示 了 对 应 图 11-25 所 示 平 衡 括号 串 无 二 义 文法 的 分 析 表 。 该 分 析 表 相当 人 简单 ， 
为 其 中 只 有 一 个 语法 分 类 。 该 表 所 表示 的 策略 与 11.6 市 中 的 示例 所 采用 的 策略 是 相同 的 。 如 果 
前 瞻 符 号 是 (， 那么 展开 时 用 到 的 是 产生 式 (2)， 也 就 是 <B> 一 (<B>) <B>， 否 则 展开 时 就 要 借助 
产生 式 (1)， 或 者 说 <B> 一 e 。 我 们 很 快 就 会 看 到 这 样 的 分 析 表 是 如 何 使 用 的 。 


人 ) ENDM 
<B> 2 1 1 
































图 11-31 ”对 应 平衡 括号 串 文法 的 分 析 表 


+ 示例 11.11 
图 11-32 所 示 的 是 另 一 个 分 析 表 , 它 对 应 着 图 11-33 所 示 的 文法 , 该 文法 是 图 11-6 所 示 语 句 文 
法 的 一 个 变种 。 





W C { } S ENDM 
<S> 1 2 3 
一 人 4 4 5 4 


图 11-32” 对 应 图 11-33 所 示 文 法 的 分 析 表 
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图 11-33 中 的 文法 之 所 以 具有 这 种 形式 , 是 为 了 可 以 用 递归 下 降 (或 者 等 价 地 ， 用 这 里 描述 
的 表 驱 动 分 析 算 法 ) 进行 分 析 。 要 知道 为 什么 这 种 形式 是 必要 的 ， 首 先 考虑 一 下 图 11-6 所 示 文 
法 中 对 应 <L> 的 产生 式 。 

<L>—<L> <S>|e 

如 果 当 前 的 输入 是 开始 语句 的 s 这 样 的 终结 符 ， 那 么 可 知 <L> 一 定 至 少 由 右 部 为 <L> <5> 第 
一 个 生成 式 展 开 一 次 。 不 过 ， 如 果 不 检查 接 下 来 的 输入 并 和 弄 清 语句 列 中 共有 多 少 条 语句 ， 就 没 
法 确定 要 进行 多 少 次 展开 。 





(1) <S>— wce<5> 
(2) < {LS 
(3) <S>—s; 

(4) <7T>— <S><7T> 
(5) <7T>—} 





图 11-33 ”可 进行 递归 下 降 分 析 的 、 表 示 简 单 语句 的 文法 


我 们 在 图 11-33 中 用 到 的 方法 是 ， 记 住 程序 块 是 由 左 花 括号 后 面 跟 上 0 条 或 更 多 语句 以 及 右 
花 括 号 组 成 的 。 我 们 把 这 0 条 或 更 多 语句 以 及 右 花 括号 称 为 “尾部 ”(tail )， 并 用 语法 分 类 <7> 
表示 它 。 图 11-33 中 的 产生 式 (2) 说 明 ， 语 句 可 以 由 左 花 括号 后 面 加 上 尾部 构成 。 产 生 式 (4) 和 产 
生 式 (5) 则 表示 尾部 要 么 是 语句 后 面 跟 上 尾部 ， 要 么 直接 就 是 个 右 花 括号 。 

决定 用 产生 式 (4) 还 是 产生 式 (53) 展 开 <7> 是 件 非常 简单 的 事 。 只 有 在 右 花 括号 是 当前 输入 时 ， 
产生 式 (5) 才 行 得 通 ， 而 产生 式 (4) 只 在 当前 输入 可 以 开始 语句 时 才 有 效 。 在 我 们 的 简单 文法 中 ， 
开始 语句 的 终结 符 只 有 w、{ 和 s。 因 此 ， 在 图 11-32 中 可 以 看 到 ， 在 对 应 语法 分 类 <7> 的 那 行 中 ， 
为 这 3 个 前 瞻 符 号 选择 了 产生 式 (4)， 而 为 前 瞻 符 号 ?选择 了 产生 式 (3)。 对 其 他 的 前 瞻 符 号 而 言 ， 
我 们 不 可 能 用 它们 作为 尾部 的 开头 ， 所 以 就 要 在 对 应 <7> 的 那 行 中 把 对 应 其 他 前 瞻 符 号 的 位 置 


ya pe 
国企 。 


同样 ， 语 法 分 类 <S> 的 决定 也 很 简单 。 如 果 前 瞻 符 号 为 w, 那么 只 有 产生 式 (1) 能 起 作用 。 如 果 
前 瞻 符 号 为 {， 产 生 式 (2) 就 是 唯一 可 行 的 选择 。 而 对 前 瞻 符 号 s 来 说 ， 只 有 产生 式 (3) 是 可 行 的 。 对 
其 他 前 瞻 符 号 来 说 , 相应 的 输入 是 没 法 形成 语句 的 。 这 些 结论 解释 了 图 11-32 中 对 应 <S> 的 那 一 行 。 


11.7.2” 表 驱动 分 析 器 的 工作 原理 


所 有 的 分 析 表 都 可 以 被 实质 上 的 同一 程序 用 作 数 据 。 这 一 驱动 器 程序 具有 同时 存放 着 终结 
符 和 文法 分 类 的 文法 符号 栈 。 该 栈 可 以 被 视 作 剩 下 的 输入 必须 满足 的 目标 ， 这 些 目标 一 定 是 按 
照 从 栈 顶 到 栈 底 的 次 序 得 到 满足 的 。 

(1) 通过 确定 某 终 结 符 是 输入 的 前 瞻 符 号 ， 可 以 满足 终结 符 的 目标 。 也 就 是 说 ， 只 要 终结 符 
在 栈 顶 位 置 ， 就 要 检查 前 瞻 符 号 是 否 为 g， 如 果 是 ， 就 从 栈 中 弹出 xz， 并 读 取 要 成 为 新 前 瞻 符 
号 的 下 一 个 输入 终结 符 。 

(2) 通过 查询 分 析 表 中 行 对 应 <S> 且 列 对 应 前 瞻 符 号 的 项 ， 可 以 满足 语法 分 类 目标 <S>。 

(a) 如 果 相 应 的 项 为 空 ， 那 么 就 不 能 为 该 输入 得 出 分 析 树 ， 这 样 驱动 硕 程 序 就 失败 了 。 

(b) 如 果 相 应 的 项 含有 产生 式 ?， 就 要 把 <S> 从 栈 顶 位 置 弹出 ， 并 把 产生 式 古 部 中 的 各 个 
符号 压 入 栈 中 。 右 部 中 的 符号 是 按照 从 右 至 左 的 顺序 被 压 入 栈 的 ， 这 样 一 来 ， 右 部 
的 第 一 个 符号 最 终 就 会 处 在 栈 顶 的 位 置 ， 而 第 二 个 符号 就 紧邻 其 下 ， 以 此 类 推 。 作 
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为 特例 ， 如 果 右 部 为 e ， 就 只 要 把 <S> 从 栈 中 弹出 即 可 。 
假设 想 确 定 字符 串 s 是 否 在 L(<S>) 中 。 在 这 种 情况 下 ， 要 用 输入 中 的 s ENDM 字 符 串 "启动 驱 
动 器 ， 并 读 取 第 一 个 终结 符 作 为 前 瞻 符 号 。 活 动 记录 栈 一 开始 只 由 语法 分 类 <S> 组 成 。 


+ 示例 11.12 

我 们 对 输入 {w c s ; s ; }ENDM 使 用 图 11-32 中 的 分 析 表 。 图 11-34 展 示 了 表 驱 动 分 析 器 
所 执行 的 处 理 步 又 。 表 中 所 示 栈 的 内 容 是 按照 栈 顶 内 容 位 于 最 左 侧 的 方式 排列 的 ， 这 样 一 来 ， 
当 我 们 把 栈 顶 位 置 的 语法 分 类 替换 为 它 某 一 产生 式 的 右 部 时 ， 该 右 部 就 会 出 现在 栈 顶 的 位 置 ， 
其 中 的 符号 都 是 按照 正常 次 序 排列 。 











前 瞻 符 号 剩余 输入 





< 9 > 


{<T > 








< 了 > 





<,9 >< 了 > 





WC< ><7 了 > 





C< ><7 了 > 





< >< 了 > 





S< 了 > 


;< 了 > 





< 了 > 





< >< 了 > 





SJ< 了 > 





;< 了 > 





< 了 > 


} 


€ 























图 11-34 使 用 图 11-32 所 示 表 格 的 表 驱 动 分 析 融 的 处 理 步 又 


图 11-34 中 的 第 () 行 展示 了 初始 情况 。 因 为 要 测试 字符 串 {wcs ; s; } 是 否 属于 语法 分 类 <5>， 
所 以 一 开始 活动 记录 栈 中 只 存放 着 <S>。 给 定 字符 串 的 第 一 个 符号 { 是 前 瞻 符 号 ， 而 且 字 符 串 的 
其 余部 分 跟 上 ENDM 就 构成 了 剩 下 的 输入 。 

如 果 查 看 图 11-32 中 对 应 语法 分 类 <sS> 和 前 瞻 符 号 {的 项 ， 就 知道 必须 按照 产生 式 (2) 展 开 
<S>。 该 产生 式 的 右 部 是 {<7>， 而 且 在 我 们 到 达 第 (2) 行 时 ， 可 以 看 到 这 两 个 文法 符号 已 经 蔡 换 
了 栈 顶 的 <S>。 

现在 栈 顶 位 置 是 终结 符 {。 因 此 要 将 其 与 前 瞻 符 号 加 以 比较 。 因 为 栈 顶 和 前 瞻 符 号 相符 ， 
所 以 我 们 要 弹出 栈 顶 内 容 , 并 将 输入 游标 前 移 到 下 一 个 输入 符号 w, 这 样 它 就 成 了 新 的 前 瞻 符 号 。 
这 些 改变 反映 在 第 (3) 行 中 。 








QD 有 时 候 端 记号 ENDM 符 号 也 是 必要 的 , 它 可 以 作为 告知 我 们 已 经 到 达 输 入 末端 的 前 瞻 符 号 ， 其 他 时 候 它 只 是 用 来 
捕捉 错误 。 例 如 ， 在 图 11-31 中 ENDM 是 必要 的 ， 因 为 我 们 在 平衡 括号 串 之 后 总 有 更 多 的 括号 ,但 在 图 11-32 中 它 
不 是 必要 的 ， 对 应 ENDM 的 那 列 中 没有 任何 项 就 证 明了 一 切 。 
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接 下 来 ，<7> 位 于 栈 顶 而 且 w 是 前 瞻 符 号 ， 查阅 图 11-32 可 知 恰当 的 行动 是 用 产生 式 (4) 展 开 。 
因此 将 <7> 从 栈 中 弹出 ， 并 压 人 <S> <7>， 如 第 (4) 行 中 所 见 。 同 样 ， 现 在 处 于 栈 顶 的 <S> 会 被 产 
生 式 () 的 右 部 替代 ， 因 为 这 是 由 图 11-32 中 对 应 <S> 的 行 与 对 应 前 瞻 符 号 w 的 列 决定 的 ， 这 一 改 
变 反 映 在 第 (5) 行 中 。 在 第 (5) 行 和 第 (6) 行 之 后 , 栈 顶 的 终结 符 会 与 当前 的 前 瞻 符 号 相 比 较 ， 因 为 
每 一 对 都 能 匹配 ， 所 以 它们 被 弹出 ， 而 且 输 入 游标 前 移 。 

这 里 要 遵照 第 (7) 到 第 (16) 行 ， 核 实 每 一 步 都 是 根据 分 析 表 可 以 采取 的 合适 行为 。 因 为 在 各 
终结 符 到 达 栈 顶 时 会 与 当时 的 当前 前 瞻 符 号 匹配 , 所 以 我 们 不 会 失败 。 因 此 , 字符 串 {wcs;s;} 
在 语法 分 类 <S> 中 ， 也 就 是 说 ， 它 是 语句 。 


11.7.3 分析 树 的 构建 


上 面 描述 的 算法 可 以 分 辨 给 定 字 符 串 是 否 在 给 定语 法 分 类 中 ， 不 过 它 并 不 会 生成 分 析 树 。 
不 过 ， 对 该 算法 进行 简单 的 修改 ， 它 就 能 在 输入 字符 串 在 初始 化 活动 记录 栈 所 用 的 语法 分 类 中 
时 给 出 相应 的 分 析 树 。11.6 节 中 描述 过 的 递归 下 降 分 析 咒 是 从 下 向 上 构建 分 析 树 的 ， 也 就 是 说 ， 
从 叶子 节点 开始 ， 并 在 函数 调用 返回 时 逐渐 将 其 组 合成 更 大 的 子 树 。 

而 对 表 驱 动 分 析 器 来 说 , 自 上 而 下 地 构建 分 析 树 要 更 方便 。 也 就 是 说 , 我 们 从 根 节点 开始 ， 
并 且 随 着 我 们 不 断 选 择 用 来 展开 栈 顶 位 置 语法 分 类 的 产生 式 ， 就 同时 为 构建 中 的 分 析 树 的 节点 
创建 了 子 节点 ， 这 些 子 节 点 对 应 着 所 选 产 生 式 右 部 中 的 符号 。 构 建 分析 树 的 规则 如 下 所 述 。 

(1) 一 开始 ， 活 动 记 录 栈 中 只 含有 某 个 语法 分 类 ， 比 方 说 是 <S>。 我 们 将 分 析 树 初始 化 为 只 
含 一 个 标号 为 <S> 的 节点 。 栈 中 的 <S> 对 应 着 正在 构建 的 分 析 树 中 的 一 个 节点 。 

(CO) 一 般 情况 下 ， 如 果 活 动 记录 栈 含有 符号 成 筷 … 碟 ， 而 且 总 在 栈 顶 ， 那 么 当前 分 析 树 的 
叶子 节点 标号 从 左 到 右 排列 可 以 组 合成 以 了 和 X,… 耻 ,为 后 绎 的 字符 串 s。 分 析 树 的 后 个 叶子 节 
点 对 应 着 栈 中 的 符号 ， 所 以 每 个 栈 符号 思 都 与 标号 为 也 的 叶子 节点 对 应 。 

(3) 假设 语法 分 类 <5> 位 于 栈 顶 ， 而 且 选 择 用 产生 式 <S> 一 也 … 了 的 右 部 替代 <S>。 我 们 会 找 
到 分 析 树 中 对 应 这 一 <S> 的 叶子 节点 ( 它 是 以 语法 分 类 为 标号 的 最 左 子 节点 ), 并 给 它 n 个 从 左 至 右 
标号 分 别 为 了 马 …、 工 的 子 节点 。 而 在 右 部 为 e 的 特例 中 ， 我 们 会 创建 一 个 标号 为 e 的 子 节点 。 


+ 示例 11.13 

我 们 按照 图 11-34 中 的 步骤 进行 处 理 , 并 在 这 一 过 程 中 构建 分 析 树 。 首 先 ， 在 第 (1) 行 , 活动 
记录 栈 只 由 <5> 组 成 ， 而且 对 应 的 树 是 如 图 11-35a 所 示 的 单个 节点 。 在 第 (2) 行 要 用 产生 式 <5> 一 
{<72> 展 开 <S>， 因 此 就 为 图 11-35a 中 的 叶子 节点 赋予 了 两 个 子 节点 ， 从 左 至 右 分 别 以 {和 <7> 为 
标号 。 对 应 第 (2) 行 的 树 如 图 11-35b 所 示 。 


<5> <S> <S> 
{ < <T> 
pS Re 
<SH> 


<TS 























(a) (b) (9 
图 11-35 ”构建 分 析 树 的 前 几 步 
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第 (3) 行 不 会 对 分 析 树 带 来 改变 ， 因 为 我 们 匹配 的 是 终结 符 ， 不 会 展开 语法 分 类 。 不 过 在 第 
(4) 行 要 将 <7> 展 开 为 <S> <7T>， 所 以 要 为 图 11-35b 中 标号 为 <T2 的 叶子 节点 添加 两 个 以 这 些 符号 
为 标号 的 子 节点 ， 如 图 11-35c 所 示 。 然 后 在 第 (5) 行 <$> 被 展开 为 wc <S>， 这 会 让 图 11-35c 中 标号 
为 <$> 的 叶子 节点 得 到 3 个 子 节点 。 大 家 可 以 自行 继续 这 一 过 程 。 最 终 的 分 析 树 如 图 11-36 所 示 。 


-op 


” 


{ <T> 
”< 
<S5> <T> 
0 
Ww c < <0OF <T'> 
Se < 
S Ss . } 


图 11-36 ”对 应 图 11-34 中 分 析 过 程 的 完整 分 析 树 


11.7.4 ”让 文法 变 得 可 分 析 

正如 我 们 已 经 看 到 的 , 很 多 文法 需要 进行 一 些 修改 才能 用 我 们 在 11.6 和 11.7 这 两 节 中 了 解 的 
递归 下 降 或 表 驱 动 方法 进行 分 析 。 尽 管 无 法 保证 任何 文法 都 能 修改 为 可 用 这 两 种 方法 分 析 ， 但 
有 一 些 值得 了 解 的 小 窍门 ， 它 们 可 以 让 这 种 使 文法 变 得 可 分 析 的 修改 工作 变 得 更 高 效 。 

第 一 个 窒 门 是 消除 左 递归 。 我 们 已 经 在 示例 11.11 中 指出 过 ， 产 生 式 <L> 一 <L> <5>|e 是 不 
能 用 这 些 方 法 分 析 的 ， 因 为 没 办 法 弄 清 应 用 第 一 个 产生 式 的 次 数 。 一 般 来 说 ， 只 要 对 应 某 语 法 
分 类 < 他 的 产生 式 的 右 部 以 < 从 自身 开头 ， 我 们 就 不 清楚 为 了 展开 < 他 要 应 用 该 产生 式 多 少 次 。 
这 种 情况 就 叫 作 专递 归 。 不 过 ， 通 党 可 以 重新 排列 有 问题 产生 式 的 右 部 中 的 符号 ， 使 得 < 交 排 
在 靠 后 的 位 置 。 这 一 步 又 就 叫 作 左 递 归 的 消除 。 


+ 示例 11.14 

在 之 前 讨论 过 的 示例 11.11 中 ， 我 们 看 到 <Z> 表 示 0 个 或 更 多 <S>。 因 此 可 以 通过 调换 <S> 和 
<Z> 的 位 置 消 除 左 递 局， 这 样 一 来 就 有 

<L> 一 <9> <L>|e 

再 举 个 例子 ， 考 虑 一 下 表示 数字 的 产生 式 : 

< 数字 > 一 < 数字 > < 数码 > | < 数码 > 

给 定数 码 作为 前 瞻 符 号 ， 就 不 知道 要 展开 < 数字 > 需要 使 用 第 一 个 产生 式 多 少 次 。 不 过 , 我 
们 看 到 数字 是 一 个 或 多 个 数码 ， 这 样 就 可 以 重新 排列 第 一 个 产生 式 的 右 部 ， 得 到 

< 数字 > 一 < 数码 > < 数字 > | < 数码 > 
这 一 对 产生 式 就 消除 了 左 递归 。 

不 过 ,示例 11.14 中 的 产生 式 还 是 不 能 用 我 们 提 过 的 方法 分 析 。 要 让 它们 变 得 可 分 析 ， 就 需 
要 用 到 第 二 个 容 门 一 一 提取 左 因子 (left factoring )。 当 对 应 语法 分 类 < 了 他 的 两 个 产生 式 具 有 以 相 
同 符号 C 开 头 的 右 部 时 , 只 要 前 瞻 符 号 是 来 自 共 有 符号 C 的 , 我们 就 没 法 弄 清 该 使 用 哪个 产生 式 。 
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要 为 这 些 产生 式 提 取 左 因子 ,就 要 创建 表示 这 些 产生 式 “ 尾 部 ”, 即 表示 右 部 中 C 之 后 的 部 分 
的 语法 分 类 <7>。 然 后 把 这 两 个 对 应 < 好 的 产生 式 蔡 换 为 < 轮 一 C<7> 和 两 个 以 <7> 为 左 部 的 两 个 产 
生 式 。 这 两 个 产生 式 的 右 部 是 之 前 所 说 的 “尾部 ”, 也 就 是 对 应 < 窑 的 两 个 产生 式 中 C 之 后 的 内 容 。 





+ 示例 11.15 

考虑 一 下 示例 11.14 中 设计 的 对 应 < 数字 > 的 产生 式 : 

< 数字 > 一 < 数码 > < 数字 > | < 数码 > 

这 两 个 产生 式 是 以 相同 符号 < 数码 > 开始 的 。 因 此 ， 当 前 瞻 符 号 为 数码 时 ， 我 们 没 法 分 辩 要 
使 用 哪个 产生 式 。 不 过 ， 如 果 提 取 左 因子 ， 得 到 

< 数字 > 一 < 数码 > < 尾部 > 

< 尾部 > 一 < 数字 >|e 
就 可 以 服从 这 些 决定 了 。 在 这 里 ， 对 应 < 尾部 > 的 这 两 个 产生 式 让 我 们 选择 对 应 < 数字 > 的 第 一 个 
产生 式 的 尾部 ， 也 就 是 < 数字 > 本 有 号， 或 者 第 二 个 对 应 < 数字 > 的 产生 式 的 尾部 ， 即 e 。 

现在 ， 当 必须 扩展 < 数字 >， 并 以 数码 作为 前 瞻 符 号 时 ， 就 会 用 < 数码 > < 尾部 > 替换 < 数字 >， 
匹配 该 数码 ， 然 后 可 以 根据 数码 后 面 跟 着 的 内 容 选 择 如 何 展 开 尾部 。 也 就 是 说 ， 如 果 后 面 跟着 
男 一 个 数码 ， 那 么 就 用 < 尾部 > 的 第 一 个 选择 展开 ， 而 如 果 后 面 跟着 的 内 容 不 是 数码 ， 则 可 知已 
经 看 到 整个 数字 ， 并 用 e 来 奉 换 < 尾部 >。 








11.7.5 “习题 
(1) 为 下 列 输入 字符 串 模拟 使 用 图 11-32 所 示 分 析 表 的 表 驱 动 分 析 器 。 


(a) {s;} 

(b) wc{s;s;} 
(c) {{s;s;}s;} 
(d) {s;s} 


(2) 对 习题 (1) 中 取得 成 功 的 那些 分 析 ， 给 出 分 析 过 程 中 构建 分 析 树 的 过 程 。 

(3) 利用 图 11-31 中 的 分 析 表 ， 对 11.6 节 习题 (1) 中 的 输入 串 模 拟 表 驱动 分 析 髓 。 

(4) 给 出 习题 (3) 的 分 析 过 程 中 分 析 树 的 构建 情况 。 

(5) * 如 下 文法 
(a) < 语句 > 一 i£f (人 条件) 
(b) < 语句 > 一 if (条件) < 语句 > 
(c) < 语句 > 一 简单 语句 
表示 C 语 言 中 的 选择 语句 。 它 是 没 法 用 递归 下 降 分 析 器 和 表 驱 动 分 析 器 进行 分 析 的 ， 因 为 如 果 有 
前 瞻 符 号 i£， 就 没 办 法 确定 要 使 用 前 两 个 产生 式 中 的 哪 一 个 。 为 该 文法 提取 左 因 子 ， 使 它 可 以 用 
11.6 节 和 本 节 介 绍 的 算法 分 析 。 提 示 : 在 提取 左 因 子 时 ， 就 得 到 了 具有 两 个 产生 式 的 新 语法 分 类 。 
一 个 的 右 部 为 e ， 而 另 一 个 的 右 部 则 以 else 开 头 。 显 然 ， 当 else 作 为 前 瞻 符 号 时 ， 要 选择 第 二 
个 产生 式 。 其 他 前 瞻 符 号 都 不 能 让 我 们 选择 这 一 产生 式 。 不 过 ， 如 果 看 看 有 哪些 前 瞻 符 号 让 我 们 
用 右 部 为 e 的 产生 式 展 开 ， 就 会 发 现 这 些 前 瞻 符 号 中 也 有 else。 不 过 ,也 可 以 强行 规定 ,在 前 瞻 
符号 为 else 时 决 不 展开 为 e 。 该 选择 对 应 着 “else 匹 配 之 前 未 匹配 的 then” 这 一 规则 ， 因 此 这 
是 “正确 的 ”选择 。 你 可 能 想 找 到 一 个 在 前 脆 符 号 为 else 且 展开 为 ce 时 还 能 让 分 析 器 完成 分 析 的 
例子 。 不 过 你 会 发 现 , 在 任意 一 次 这 样 的 分 析 中 , 构建 的 分 析 树 总 会 为 else 匹 配 “ 错 误 的 ”then。 

(6) ** 如 下 文法 
< 结构 体 > 一 struct {< 字段 列 > 
< 字段 列 > 一 类 型 字段 名 ; < 字段 列 > 
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< 字段 列 > 一 cc 
需要 一 些 修 改 才 可 以 用 本 节 和 11.6 节 介绍 的 方法 进行 分 析 。 重 写 该 文法 ， 使 其 可 由 递归 下 降 和 表 
驱动 的 方法 分 析 ， 并 构建 相应 的 分 析 表 。 


11.8 ”文法 与 正则 表达 式 


文法 和 正则 表达 式 都 是 用 于 描述 语言 的 表示 法 。 我 们 在 第 10 章 中 已 经 看 到 ， 正 则 表达 式 表 
示 法 与 确定 自动 机 和 非 确定 自动 机 表示 法 是 等 价 的 , 因为 可 由 这 3 种 表示 法 描述 的 语言 集合 是 相 
同 的 。 文 法 是 否 有 可 能 是 男 一 种 与 我 们 已 经 见 过 的 这 些 表示 法 都 等 价 的 表示 法 ? 

答案 是 “不 可 能 ”， 因 为 文法 要 比 我 们 在 第 10 章 中 介绍 的 正则 表达 式 之 类 的 表示 法 更 强大 。 
这 里 要 分 两 步 展 现 文法 的 表现 力 。 首 先 ， 我 们 将 证 实 每 种 能 用 正则 表达 式 描述 的 语言 也 都 能 
文法 来 描述 。 接 着 我 们 会 给 出 一 种 可 以 由 文法 描述 ,但 不 能 用 正则 表达 式 描述 的 语言 。 


11.8.1 用 文法 模拟 正则 表达 式 


这 种 模拟 背后 的 直觉 思路 就 是 ， 正则 表达 式 中 的 3 种 运算 符 ( 取 并 、 串 接 和 闭 包 ) 分 别 可 以 
用 一 个 或 两 个 产生 式 “ 模 拟 ”。 正 式 地 讲 ， 可 以 通过 对 正则 表达 式 R 中 出 现 的 运算 符 的 数量 n 进 
行 完 全 归纳 ， 证 明 如 下 命题 。 

命题 。 对 每 个 正则 表达 式 R 来 说 ， 都 存在 某 一 文法 ,满足 对 文法 中 的 语法 分 类 <5> 而 言 ， 有 
L(<S>) = L<R> 

也 就 是 说 ， 由 正则 表达 式 表示 的 语言 也 是 语法 分 类 <S> 的 语言 。 

依据 。 依 据 情 况 是 n = 0， 也 就 是 正则 表达 式 R 中 未 出 现 运算 符 的 情况 。R 要 么 是 单个 符号 ， 
比方 说 zx， 要 么 是 e 或 @ 。 我 们 创建 一 个 新 的 语法 分 类 <S>。 在 R=x 的 第 一 种 情况 下 ， 还 要 创建 
产生 式 <S> 一 X。 因 此 ，Z(KS>) = {x}， 而 且 L<R> 也 是 相同 的 单字 符 串 语言 。 如 果 R 是 e ， 同 样 可 
以 为 <S> 创建 产生 式 <S> 一 e ， 而 如 果 R = 名 ， 则 根本 不 用 为 <$> 创 建 产 生 式 。 这 样 当 R 为 e 时 ， 
L(<S>) 是 {fe }; 而 当 R 是 名 时 ,LL(<S>) 是 如。 

归纳 。 假 定 归纳 假设 对 具有 不 超过 n 个 运算 符 的 正则 表达 式 成 立 。 设 R 是 其 中 出 现 n + 1 个 运 
算 符 的 正则 表达 式 。 总 共有 3 种 情况 ， 具 体 取决 于 构建 R 所 应 用 的 最 后 一 个 运算 符 是 取 并 、 串 接 
还 是 闭 包 。 

(1) R= R|R,。 因 为 这 里 有 一 个 运算 符 ( 即 取 并 运算 符 | ) 既 不 属于 R 也 不 属于 R,， 所 以 可 
知 R 和 RR 中 运算 符 的 个 数 都 不 可 能 超过 n。 因 此 ， 归 纳 假设 适用 于 R 和 R,， 而 且 我 们 可 以 找到 
具有 语法 分 类 <SI> 的 文法 G ， 以 及 具有 语法 分 类 <y>> 的 文法 G, ,分别 满足 L(<51>)=L(R1) 和 
ZL(<S2>)=L(Ry)。 为 了 避免 出 现 两 个 文法 相互 融合 的 巧合 出 现 ， 我 们 可 以 假设 ,在 构造 新 文法 的 过 
程 中 ， 所 创建 的 语法 分 类 的 名 称 一 直 都 不 会 在 另 一 个 文法 中 出 现 。 这 样 一 来 ，G 和 G, 中 就 不 会 
有 相同 的 语法 分 类 。 创建 一 个 新 的 语法 分 类 <S>, 它 既 未 出 现在 G 和 G, 中 , 也 没有 出 现在 为 其 他 
正则 表达 式 构建 的 其 他 文法 中 。 除 了 对 应 G 和 G, 的 两 个 产生 式 外 ,我们 还 要 添加 两 个 产生 式 

<S>— <S>|<5,> 
那么 <S> 的 语言 只 由 <$1> 和 <S$;> 的 语言 中 所 有 的 字符 串 组 成 。 这 两 个 语言 分 别 是 L(R1) 和 L(R,)， 
所 以 有 















































er L(<S>)= LRY)Y LR)= LR) 
这 正 是 我 们 想 要 的 结 
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(2) R= RR, 。 就 像 情况 (1) 那 样 , 假 设 存在 文法 G 和 G, ,它们 分 别 具 有 语法 分 类 <S1> 和 <52>， 
满足 L(<5$1>)=L(RI1) 和 LL(<S2>)=L(R,)。 然 后 创建 新 的 语法 分 类 <S>， 并 在 G 和 G, 产生 式 的 基础 之 
上 添加 产生 式 





<9> 一 <SI> <6,> 
然后 就 有 Z(<S>) = Z(<Si>) Z(<9>)。 
(3) R=R 。 设 G 是 具有 语法 分 类 <Si> 的 文法 ， 满 足 Z(<S>)=ZCRD)。 创 建新 语法 分 类 <S>， 
并 添加 两 个 产生 式 





<9> 一 <91> <9>|e 
为 <S> 可 生成 由 0 个 或 更 多 <y> 构 成 的 串 ， 所 以 有 7(<S>) = (ZL(<S1>))*。 


+ 示例 11.16 
考虑 正则 表达 式 a |bc*。 首 先 要 为 该 表达 式 中 的 3 个 符号 创建 语法 分 类 。" 因此， 就 得 到 产 

村 式 

<A>—a 

<B>—b 

<C> 一 C 
根据 正则 表达 式 的 组 合 规 则 ， 我 们 的 表达 式 会 被 分 组 为 a| (b(c)*)。 因 此 ， 首 先 要 创建 对 应 c* 
的 文法 。 根 据 之 前 所 述 的 规则 (3)， 我 们 要 在 产生 式 <C> 一 c (就 是 对 应 正则 表达 式 c 的 文法 ) 的 
基础 之 上 添加 产生 式 

<D> 一 <C> <D>|e 

这 里 的 语法 分 类 <D> 是 随意 选择 的 ， 可 以 是 除了 已 经 被 使 用 过 的 <4> 、<B> 和 <C> 之 外 的 任何 语 
法 分 类 。 要 注意 到 





L(<D>)= (L(<C>)*=e™ 
现在 我 们 需要 对 应 bc* 的 文法 。 可 以 取 只 由 产生 式 <B> 一 b 组 成 的 对 应 b 的 文法 ， 以 及 对 应 ce* 的 
文法 ， 即 
<C> 一 C 
<D> 一 <C> <D>|e 
我 们 要 创建 新 的 语法 分 类 <E> ， 并 添加 产生 式 
<E> 一 <B> <D> 
之 所 以 使 用 该 产生 式 ， 是 因为 之 前 提 到 的 对 应 串 接 情况 的 规则 (2)。 它 的 右 部 包含 <B> 和 <D>， 
为 它们 分 别 是 对 应 正则 表达 式 b 和 ec* 的 语法 分 类 。 因 此 对 应 bec* 的 文法 是 
<E> 一 <B> <D> 
<D> 一 <C> <D>|e 
<P> 一 
<C> 一 C 
而 且 语 法 分 类 <E> 的 语言 就 是 所 需 的 。 
最 后 ， 要 得 到 对 应 整个 正则 表达 式 的 文法 ， 就 要 用 到 对 应 取 并 运算 的 规则 (1)。 这 要 引入 新 
的 语法 分 类 <F>， 以 及 产生 式 








G 如 果 这 些 符 号 出 现 两 次 或 多 次 ， 并 不 需要 为 符号 的 每 次 出 现 创 建新 的 语法 分 类 ， 只 需要 为 每 种 符号 创建 一 个 语 
法 分 类 就 足够 了 。 
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<F>— <4>|<E> 
请 注意 ， 语 法 分 类 <4> 对 应 子 表 达 式 a， 而 <E> 则 对 应 子 表 达 式 bc*。 得 到 的 文法 就 是 
<F>— <A4>|<E> 
<E> — <B> <D> 
<D> 一 <C> <D>|e 
<4> 一 己 





< 有 > 一 了 
<C>—cC 
而 语法 分 类 <F> 的 语言 就 是 给 定 正则 表达 式 所 表示 的 语言 。 
11.8.2 ”有 文法 但 没有 正则 表达 式 的 语言 
现在 要 证 实 文法 并 非 只 有 正则 表达 式 那 么 强大 。 我 们 要 通过 展示 一 种 只 有 文法 但 没有 正则 
表达 式 的 语言 来 做 到 这 一 点 。 我 们 将 这 一 语言 称 为 已 ， 它 是 由 一 个 或 更 多 0 后 面 跟 上 相等 数量 的 
1 组 成 的 字符 串 的 集合 。 也 就 是 说 
E= {01, 0011, 000111, ...} 
要 描述 E 中 的 字符 串 ， 有 一 种 基于 指数 的 实用 表示 方法 。 设 s”( 其 中 s 是 字符 串 而 n 是 整数 ) 代表 
ss…S (7 个 5 )， 也 就 是 说 ，s 与 它 自 号 串 接 n 次 。 那 么 
E=40 1 0 0 ,0 








或 者 使 用 集合 形成 法 表示 就 是 
E= {0"1"n>1} 

首先 ， 我 们 要 相信 可 以 用 文法 描述 E。 以 下 文法 就 可 以 完成 这 一 工作 。 

(1) <S>—0<5>1 

(2) <S> 一 01 

大 家 可 以 使 用 依据 产生 式 (2) 说 明 01 在 L(<5>) 中 。 在 第 二 轮 中 , 我 们 可 以 使 用 产生 式 (1), 用 
01 替 换 右 部 中 的 <S>， 这样 就 为 L(<5>) 得 到 了 0”1”。 再 一 次 应 用 产生 式 (1)， 用 0”1 替 换 右 部 中 的 
<S>， 就 说 明 01 也 在 CC<S>) 中 ， 等 等 。 一 般 来 说 ，0"1" 要 求 使 用 产生 式 (2) 一 次 ， 并 随后 使 用 产 
生 式 (1) xz 一 1 次 。 因 为 我 们 用 这 两 个 产生 式 不 能 产生 别 的 字符 串 ， 所 以 可 知已 = Z(<S>)。 


11.8.3 ”证 明 E 不 能 用 任何 正则 表达 式 定 义 


现在 要 证 明 E 不 能 用 正则 表达 式 描述 。 这 里 证 明 E 不 能 用 任何 确定 有 限 自 动机 描述 要 更 容易 
些 。 这 一 证 明 过 程 也 能 证 明 E 没 有 正则 表达 式 ， 因 为 如 果 E 是 正则 表达 式 R 的 语言 ， 我 们 就 可 以 
利用 10.8 节 中 的 技巧 将 R 转 换 成 等 价 的 确定 有 限 自动 机 。 该 确定 有 限 自 动机 就 定义 了 语言 E。 

因此 , 假设 有 是 茶 确 定 有 限 上 自动 机 4 的 语言 。 那 么 4 就 会 有 奋 干 数量 的 状态 ， 比 方 说 是 m 个 状 
态 。 考 虑 一 下 当 4 接 收 输入 000… 时 会 发 生 什么 。 我 们 这 里 把 该 未 知 自 动机 4 的 初始 状态 叫 作 so。 
4 一 定 有 针对 输入 0 的 、 从 状态 8 到 某 个 我 们 称 之 为 % 的 状态 的 转换 。 从 该 状态 出 发 ， 必 一 个 0 
可 以 把 4 带 到 称 为 5; 的 状态 ， 等 等 。 一 般 地 说 ， 在 读 入 i 个 0 后 就 处 在 状态 5 中 ， 如 图 11-37 所 示 。™ 





























QD 大 家 应 该 记 住 , 我 们 其 实 并 不 知道 4 的 状态 的 名 称 , 而 是 只 知道 4 具有 mm 个 状态 ( 其 中 m 为 某 整 数 ) 因此 , so、…、 
sm 并 不 是 4 中 状态 的 真正 名 称 ， 而 只 是 我 们 为 了 方便 称呼 而 为 这 些 状态 赋予 的 名 称 。 这 并 不 像 看 起 来 这 么 奇怪 。 
打 个 比方 ,我 们 一 般 会 创建 数组 *， 用 0 到 mm 作为 索引 ,并 在 s 四 中 存储 某 值 ， 该 值 可 以 是 自动 机 4 的 状态 名 称 。 然 
后 可 以 在 程序 中 用 s[] 代 指 该 状态 ， 而 不 是 用 它 本 身 的 名 称 。 
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图 11-37 为 自动 机 4 输送 0 








鲍 巢 原理 


证 明 语 言 B 没 有 确定 有 限 自动 机 的 过 程 要 用 到 称 作 鲍 业 原理 ( pigeonhole principle ) 的 技巧 ， 
我 们 通常 将 该 原理 陈述 为 : 

“如 果 1n+1l 只 铝 子 飞 进 凡 个 鲍 梨 ， 那 么 至 少 有 一 个 梨 中 有 两 只 后 子 。 

在 这 种 情况 下 ， 铅 梨 就 相当 于 自动 机 4 的 状态 ， 而 铝 子 就 是 4 在 看 到 0 个 、1 个 、2 个 直至 妨 
个 0 后 所 处 的 m 个 状态 。 

请 注意 ， 为 了 应 用 够 集 原 理 ， 这 里 的 m 必 须 是 有 限 的 。7.11 节 中 讲 过 的 无 限 酒店 的 故事 告 
诉 我 们 ,对 立 的 命题 对 无 限 集 来 说 是 可 以 成 立 的 。 在 那个 例子 中 , 我们 看 到 一 家 有 着 无 数 个 房 
间 ( 对 应 铝 梨 ) 的 酒店 ， 以 及 数量 比 房间 数 多 1 的 客人 (对 应 鸽子 )， 不 过 还 是 有 可 能 为 每 个 客 
人 分 配 一 个 房间 ， 而 不 用 把 两 个 客人 安排 到 同一 房间 中 。 





现在 假设 4 刚好 有 mm 个 状态 , 而且 s。、s, 、…、s, 总 共有 m+1 个 状态 。 因 此 不 可 能 让 这 些 状 
态 全 都 不 同 。 在 0 到 m 的 范围 中 ， 肯 定 存在 两 个 不 同 的 整数 ;和 jy， 使 得 s, 和 ss 其实 为 相同 状态 。 
如 果 假 设 是 i 和 j 之 间 的 较 小 者 ,那么 图 11-37 的 路 径 之 中 一 定 至 少 存在 一 条 环 路 , 如 图 11-38 所 示 。 
在 实际 应 用 中 ， 可 能 存在 比 图 11-38 中 更 多 的 环 路 和 状态 重复 。 还 要 注意 ,i 可 以 是 90， 在 这 种 情 
况 下 , 图 11-38 所 示 的 从 so 到 s 的 路 径 起 始 就 是 一 个 节点 。 同样 ，s ,可 以 是 5s,, 这 种 情况 下 从 5s， 
到 s, 的 路 径 就 只 是 个 节点 。 











图 11-38 图 11-37 中 的 路 径 一 定 含 有 环 路 


图 11-38 暗 示 了 自动 机 4 不 能 “ 记 住 ”自己 已 经 看 到 过 多 少 个 0。 如 果 处 在 状态 s, 中 ， 它 可 
能 已 经 刚好 看 到 了 m 个 0, 这 样 的 话 ， 如 果 我 们 从 状态 m 开 始 ， 并 为 4 提供 刚好 m 个 1， 那么 4 一 定 
会 到 达 接 受 状 态 ， 如 图 11-39 所 示 。 

不 过 , 假设 我 们 为 4 提供 了 一 个 有 m+tj-i 个 0 的 串 。 看 看 图 11-38， 就 会 发 现 i 个 0 可 以 将 4 从 s。 
带 到 与 ,相同 的 s,。 我 们 还 会 看 到 m-j 个 0 会 把 4 从 状态 s, 带 到 s,。 因 此 ，m-j+ti 个 0 就 可 以 把 4 
从 状态 s, 带 到 s,， 如 图 11-39 中 靠 上 方 的 路 径 那 样 。 
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Om-I+i 


0 
图 11-39 ”自动 机 4 不 能 区 分 它 到 底 是 看 到 了 m 个 0 还 是 m-j+1 个 0 


因此 ，m-j+ti 个 0 后 面 跟 上 m 个 1 也 可 以 把 4 从 s, 带 到 接受 状态 。 换 句 话 说 ,字符 串 0” 1” 
也 在 4 的 语言 中 。 但 因为 j/ 比 大， 所 以 该 串 中 的 1 要 比 0 多 ， 这样 就 不 在 语言 gE 中 。 因 此 可 得 出 4 
的 语言 并 不 是 E 的 结论 ， 正 如 我 们 所 假设 的 那样 。 

因为 一 开始 只 假设 了 E 具 有 确定 有 限 自 动机， 而 且 最 终 推 出 了 矛盾 ， 所 以 可 推断 出 假设 不 
成 立 ， 也 就 是 说 ，E 没 有 确定 有 限 自 动机 。 因 此 ，E 也 没有 正则 表达 式 。 

语言 {0”1"|n 宇 1} 只 是 无 数 种 可 由 文法 指定 但 不 能 用 正则 表达 式 表 示 的 语言 中 的 一 个 例子 。 
本 闻 习 题 中 还 会 给 出 吃 外 一 些 例子 。 


11.8.4 “习题 


(1) 给 出 定义 以 下 正则 表达 式 语言 的 文法 。 
(a) (a|b)*a 
(b) a*lb*| (ab)* 
(Cc) a*b*ce* 

















文法 不 能 定义 的 语言 

有 人 可 能 会 问 文法 是 否 为 描述 语言 的 最 强大 表示 法 ， 答 案 是 : “ 绝 不 可 能 ! ”我 们 可 以 证 明 一 些 简 
单 语 言 并 不 具有 文法 ， 尺 管 证 明 技 巧 并 不 在 本 书 要 介绍 的 范围 之 内 。 这 种 的 语言 的 一 个 例子 就 是 由 相同 
数量 的 0、1 和 2 按 次 序 构成 的 串 形 成 的 集合 ， 也 就 是 

{012, 001122, 000111222, …:} 

要 举 一 个 更 强大 的 语言 描述 方法 的 例子 ， 可 以 考虑 一 下 C 语 言 本 身 。 对 任意 文法 ， 以 及 它 的 任 一 语 
法 分 类 <S> 来 说 ， 都 可 以 写 出 C 语 言 程 序 以 确定 字符 串 是 否 在 Z(<S>) 中 。 此 外 ， 确 定 字 符 串 是 否 在 上 述 语 
言 中 的 C 语 言 程序 也 不 难 编写 。 

但 还 是 有 C 语 言 程序 不 能 定义 的 语言 。“ 不 可 判定 问题 ”这 一 高 雅 理论 就 可 用 来 证 明 某 些 问题 是 不 
能 用 任何 计算 机 程序 解决 的 。 我 们 将 在 14.10 节 中 简要 讨论 不 可 判定 性 以 及 一 些 不 可 判定 问题 的 例子 。 





(2) * 证 明 平 衡 括号 串 集合 不 能 由 任何 正则 表达 式 定义 。 提 示 : 这 一 证 明 过 程 与 上 述 针 对 语言 5 的 证 明 
过 程 类 似 。 假 设 平衡 括号 串 集 合 具 有 含 m 个 状态 的 确定 有 限 自动 机 。 为 该 自动 机 提供 m 个 (， 然 后 
检查 它 进入 的 状态 。 证 明 该 自动 机 可 能 被 “ 轴 弄 ”去 接受 某 个 不 平衡 的 括号 串 。 

G) * 证 明 由 形 如 o10" 的 字符 串 (也 就 是 两 列 等 长 的 0 由 一 个 1 分 开 ) 组 成 的 语言 是 不 可 以 用 正则 表 
达 式 定义 的 。 

(4) * 大 家 有 时 候 可 能 会 看 到 一 些 雇 误 的 断言 ,声称 像 本 节 中 这 样 的 语言 可 以 用 正则 表达 式 描述 。 扒 
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理 过 程 是 ， 对 各 个 n 而 言 ，0"TP 就 是 定义 只 售 0"1" 这 一 个 字符 串 的 语言 的 正则 表达 式 。 因 此 下 列 
正则 表达 式 就 是 描述 有 的 。 
0102110: 王 |… 

这 一 论证 过 程 错 在 何 处 ? 

(5) * 另 一 个 和 语言 有 关 的 廖 误 论证 声称 刀具 有 以 下 有 限 自 动机 。 该 自动 机 具有 一 个 状态 ea， 它 既是 起 
始 状态 又 是 接受 状态 。 存 在 从 ca 到 它 自 身 的 针对 符号 0 和 1 的 转换 。 那 么 显然 字符 串 01 能 把 自动 
机 从 状态 a 带 到 状态 ce， 这 样 该 字符 串 就 被 接受 了 。 为 什么 这 一 论证 过 程 没 有 证 明天 是 某 有 限 自 动 
机 的 语言 ? 

(6) ** 证 明 下 列 语言 不 能 用 正则 表达 式 定 义 。 
(a) fwwlw 是 由 ae 和 2 组 成 的 字符 串 ，w 是 与 w 排 列 次 序 相 反 的 字符 串 } 
(b) {0'|i 是 完全 平方 数 } 
(c) {0'|i 是 质数 } 

其 中 哪些 语言 可 以 用 文法 定义 ? 

















11.9 ”小 结 





在 阅读 过 本 章 之 后 ， 大 家 应 该 注意 以 下 要 点 。 

口 (上 下 文 无 关 ) 文法 如 何 定义 语言 。 

口 如 何 构 建 可 以 表示 字符 串 文法 结构 的 分 析 树 。 

口 二 义 文法 有 何 收 义 ， 为 什么 编程 语言 的 规范 中 不 需要 二 义 文法 。 

口 可 用 来 为 某 些 类 型 的 文法 构建 分 析 树 的 递归 下 降 分 析 技术 。 

口 用 于 实现 递归 下 降 分 析 融 的 表 驱 动 方式 。 

D 为 什么 文法 与 正则 表达 式 或 有 限 自 动机 相 比 是 更 强大 的 描述 语言 的 表示 法 。 
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本 章 要 介绍 命题 逻辑 ， 是 种 最 初 目 的 是 为 了 模型 推理 的 代数 ， 其 历史 要 追溯 到 亚 里 士 多 德 
的 时 代 。 在 更 近 的 时 代 里 ， 这 种 代数 和 很 多 代数 一 样 ， 是 实用 的 设计 工具 。 例 如 ， 第 13 章 就 展 
示 了 命题 逻辑 是 如 何 应 用 到 计算 机 电路 设计 中 的 。 逻 辑 的 第 三 个 用 途 是 作为 编程 语言 和 系统 ( 比 
如 Prolog 语 言 ) 的 数据 模型 。 很 多 通过 计算 机 进行 推理 的 系统 ， 包 括 定理 证 明 程 序 、 程 序 验 证 
程序 ， 以 及 人 工 智能 领域 的 应 用 ， 都 是 用 基于 逻辑 的 语言 实现 的 。 这 些 语言 一 般 都 利用 了 “请 
词 逻 辑 ”, 它 扩充 了 命题 逻辑 的 功能 , 是 更 为 强大 的 逻辑 形式 ,我们 将 在 第 14 章 中 介绍 谓词 逻辑 。 


12.1 ”本章 主 要 内 容 


12.2 节 从 直观 上 说 明了 命题 逻辑 是 什么 , 以 及 它 为 何 实用 。12.3 节 介绍 了 用 于 逻辑 表达 式 的 
代数 ， 它 使 用 布尔 值 操 作 数 ， 并 且 用 到 对 布尔 ( 真 / 假 ) 值 进 行 运算 的 AND、OR 和 NoT 这 样 的 逻 
辑 运算 符 。 这 种 代数 通常 称 为 布尔 代数 ， 是 以 首先 将 逻辑 表达 为 代数 的 逻辑 学 家 乔治 … 布尔 的 
名 字 命 名 的 。 然 后 我 们 还 会 了 解 以 下 内 容 。 

口 真 值 表 是 表示 表达 式 逻 辑 意义 的 实用 方式 (12.4 节 )。 

可 以 把 真 值 表 转 换 为 对 应 相同 逻辑 困 数 的 逻辑 表达 式 (12.5 节 )。 

卡 诺 图 是 一 种 用 于 简化 多 辑 表达 式 的 实用 制 表 技巧 (12.6 节 )。 

存在 数量 丰富 的 “ 重 言 式 ”， 或 可 用 于 逻辑 表达 式 的 代数 法 则 〈12.7 节 和 12.8 节 )。 

命题 逻辑 的 某 些 重 言 式 让 我 们 可 以 对 “ 反 证 法 ”或 “ 首 转 命题 法 ”这 样 的 常用 证 明 技 巧 

加 以 解释 ( 12.9 节 )。 

口 命题 逻辑 也 是 经 得 起 “演绎 ”的 。 所 谓 演绎 ， 就 是 写 出 一 行 行内 容 ， 其 中 每 一 行 要 么 是 
给 定 的 ， 要 么 是 能 由 之 前 的 某 些 行 来 验证 的 ( 12.10 节 )。 大 多 数 人 在 学 习 平面 几何 时 都 
了 解 过 这 种 证 明 模式 。 

口 名 为 “分 解 ”(resolution ) 的 强大 技巧 有 助 于 我 们 迅速 作出 证 明 (12.11 市 )。 


12.2 ”什么 是 命题 逻辑 


山姆 编写 了 如 下 含有 if 语 句 的 C 语 言 程序 。 
if (a<bl||l (a>=b &g c== d)) ... (12.1) 
水 者 指 出 ， 该 i£ 语 句 中 的 条 件 表达 式 可 以 写 为 如 下 更 简单 的 形式 。 
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if (a<b llc==d)... (12.2) 

水 莉 是 如 何 得 出 这 一 结论 的 ? 

她 可 能 是 按照 如 下 方式 推理 的 。 假 设 a < pb。 那么 参与 oR 运算 的 第 一 个 条 件 在 这 两 条 语句 
中 都 为 真 ， 因 此 (12.1) 和 (12.2) 这 两 条 if 语 句 中 的 then 部 分 都 会 被 接受 。 

现在 假设 a < b 不 成 立 。 在 这 种 情况 下 ， 只 有 当 参 与 OR 运算 的 第 二 个 条 件 为 真 的 情况 下 才 
会 接受 then 部 分 。 对 语句 (12.1) 我 们 要 询问 

a >= b && c ==d 

是 否 为 真 。 因 为 a < pb 为 假 ， 所 以 现在 a >= b 显 然 为 真 。 因 此 ， 在 (12.1) 中 ， 只 有 在 c == da 
为 真 时 才 接 受 then 部 分 。 而 对 语句 (12.2)， 显 然 也 是 只 有 在 c == qd 为 真 时 才 接 受 then 部 分 。 
此 不 管 a、b、c、qd 的 值 分 别 是 什么 ， 要么 是 if 语 句 都 能 带 来 接 下 来 的 then 部 分 ， 要么 是 都 不 
能 。 所 以 我 们 可 以 判断 出 莎 莉 是 对 的 ， 简 化 过 的 条 件 表达 式 可 以 在 不 改变 程序 功能 的 情况 下 替 
换 第 一 个 表达 式 。 

命题 逻辑 是 让 可 以 对 逻辑 表达 式 的 真 假 进 行 推 理 的 数学 模型 。 我 们 将 在 12.3 节 中 给 出 逻辑 
表达 式 的 正式 定义 , 不 过 现在 可 以 把 逻辑 表达 式 视 作 对 (12.1) 和 (12.2) 这 样 的 条 件 表达 式 的 简化 ， 
这 种 简化 抽象 掉 了 C 语 言 逻 辑 运 算 符 求 值 次 序 的 限制 。 


命题 和 真 值 


请 注意 ， 上 述 针 对 两 个 if 语句 的 推理 并 不 取决 于 a < b 或 相似 的 条 件 “ 意 味 着 ”什么 。 我 
们 需要 知道 的 只 有 条 件 a < b 和 a >= b 是 互补 的 ， 也 就 是 说 ， 当 一 个 条 件 为 真 时 另 一 个 条 件 就 
为 假 ， 反 之 亦 然 。 因 此 可 以 用 符号 p 蔡 换 语 句 a < pb， 用 表达 式 NOT p 蔡 代 a >= b， 并 用 符号 9 
替换 c == dq。 这 里 的 符 吕 pzp 和 49 称 为 命题 变量 ， 因 为 它们 可 以 代表 任何 “命题 ”， 也 就 是 任何 可 
以 具有 某 一 真 值 〈 真 或 假 ) 的 语句 。 

逻辑 表达 式 可 以 包含 AND 、OR 和 NoT 这 样 的 逻辑 运算 符 。 当 逻辑 表达 式 中 逻辑 运算 符 操作 
数 的 值 已 知 时 ， 表 达 式 的 值 就 可 以 通过 下 面 这 样 的 规则 确定 。 

(1) 当 且 仪 当 p 和 gq 都 为 真 时 ，p AND 4 为 真 ， 否 则 它 为 假 。 

(2) 当 p 为 真 ，q 为 真 ， 或 两 者 都 为 真 时 ，p OR gq 为 真 ， 否则 它 为 假 。 

(3) 如 果 p 为 假 ， 则 NoT p 为 真 ， 如 果 p 为 真 ， 则 它 为 假 。 

NOT 运 算 符 与 C 语 言 运 算 符 ! 具 有 相同 含义 。 运 算 符 AND 和 OR 分 别 类 似 于 C 语 言 的 运算 符 && 
和 | | ， 但 存在 技术 差异 。 不 过 ， 只 有 在 C 语 言 表达 式 具 有 副作用 时 ， 这 一 细节 才 很 重要 。 因 为 
逻辑 表达 式 的 求 值 过 程 中 是 没有 “副作用 ”的 ， 所 以 可 以 把 AND 当 作 C 语 言 运 算 符 && 的 同义词 ， 
把 oR 当 作 | | 的 同义词 。 

例如 ， 在 (12.1) 式 中 的 条 件 可 以 写 为 逻辑 表达 式 

p OR((NOT p) AND gq) 
而 (12.2) 式 可 以 写 为 p OR g。 我 们 对 (12.D 和 (12.2) 这 两 个 if 语句 的 推理 证 明了 如 下 一 般 性 命题 
p OR((NOT p) AND g)=(p OR 9) (12.3) 

其 中 = 意味 着 “等 价 于 ”或 “与 …… 具有 相同 的 布尔 值 "。 也 就 是 说 ,不管 为 命题 变量 p 和 gq 
指定 什么 样 的 真 值 ，= 的 左边 跟 右 边 要 么 都 为 真 ， 要么 都 为 假 。 我 们 发 现 对 上 面 的 等 价 性 而 
言 ， 当 p 为 真 或 当 gq 为 真 时 就 都 为 真 ， 而 如 果 p 和 gq 都 为 假 则 为 假 。 因 此 ， 我 们 得 到 了 有 效 的 
i 
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因为 p 和 g 可 以 是 任何 命题 ， 所 以 可 以 利用 (12.3) 式 简化 很 多 不 同 的 表达 式 。 例 如 ， 可 以 设 p 为 
a == b+1 && c <d 
而 q 为 a == c || b == c。 在 这 种 情况 下 ，(12.3) 的 左边 就 成 了 


(a == b+fl && c < d) || 
( I(a == brl && c < d) && (a == ¢ || b == c)) (12.4) 


请 注意 ， 我 们 为 p 和 gq 的 值 加 上 了 括号 ， 以 确保 得 到 的 表达 式 组 合 正确 。 
(12.3) 式 告诉 我 们 (12.4) 式 可 以 简化 为 (12.3) 式 的 右边 ， 也 就 是 
(a == b+l1 && c <d) || (a==c || b == c) 
再 举 个 例子 , 设 p 是 命题 “天 气 晴 天”， 而 gq 是 命题 “ 乔 伊 带 着 使 "， 那么 (12.3) 的 左边 就 成 了 
“天 气 晴朗 ， 否 则 不 是 晴天 但 蛮 伊 带 着 伞 。” 
而 右边 也 表示 同样 的 事情 ， 就 是 
“天 气 晴朗， 否则 乔 伊 融 着 企 。 











命题 逻辑 不 能 做 什么 


命题 逻辑 是 一 种 实用 的 推理 工具 , 但 它 是 有 局 限 性 的 ,因为 它 不 能 洞悉 命题 内 部 并 利用 命 
题 间 的 关系 。 上 比如， 莎 痢 写 出 了 if 语 名 

if (a<b&&ka<c& bec) ... 
然后 山姆 指出 只 要 写成 

if (a<bkgb< cl ... 
就 足够 了 。 如 果 设 六 、9 和 7 分 别 代表 命题 (a < b)、(a < c) 和 (b < c)， 这样 看 起 来 山姆 所 


说 的 就 是 

(p AND gqg AND r) =(p AND 7) 
不 过 这 一 等 价 性 并 不 总 是 存在 。 例如， 假设 p 和 /为 真 ， 而 gq 为 假 。 那 么 右边 就 为 真 ， 而 左边 却 
为 假 。 

山姆 的 简化 结果 是 正确 的 ， 但 这 里 并 不 是 利用 命题 远 辑 得 到 的 。 大 家 可 能 会 回想 起 7.10 节 
中 介绍 的 < 是 一 种 具有 传递 性 的 关系 。 也 就 是 说 ， 只 要 pp 和 /1 都 为 真 ， 也 就 是 a < b 和 Pb < c 都 
成 立 ， 那 么 就 有 9 为 真 ， 即 a < c 成 立 。 

第 14 章 将 介绍 一 种 叫 作 谓词 远 辑 的 更 为 强大 的 模型 ， 它 允许 我 们 为 命题 附加 参数 。 这 种 特 
权 让 我 们 可 以 利用 < 这 样 的 运算 符 的 特殊 属性 。 对 我 们 来 说 ， 可 以 把 谓词 视 作 第 7 章 和 第 8 章 的 
集合 论 中 关系 的 名 称 。 例如， 我 们 可 以 创建 谓词 I 表示 运算 符 <， 并 将 p、g 和 1 分 别 写 为 lt(a ,b)、 
lt(a ,c) 和 Ii(b ,c)。 那 么 ， 根据 表示 lt 属性 的 合适 法 则 ， 比 如 传递 性 ， 就 可 以 得 到 

(1(a,b) AND lt(a,c) AND lt(b,c)) = (lt(a,b) AND /t(Db,c)) 
其 实 ， 上 式 对 任何 满足 传递 律 的 谓词 1 都 是 成 立 的 ， 而 不 仅 是 对 谓词 < 成 立 。 





12.3 ”逻辑 表达 式 


正如 12.2 方 中 提 到 的 ， 逻 辑 表 达 式 可 以 按照 以 下 方式 递归 地 定义 。 
依据 。 命 题 变 量 以 及 逻辑 常量 TRUE 和 FALSE 都 是 逻辑 表达 式 ， 这 些 都 是 原子 操作 数 。 


12.3 ”逻辑 表达 式 521 





归纳 。 如 果 E 和 F 是 逻辑 表达 式 ， 那 么 
(a) E AND FF。 如 果 E 和 FF 都 为 TRUE， 则 该 表达 式 的 值 为 TRUE， 否 则 为 FALSE。 
(b) EOR。 如 果 E 为 TRUE、F 为 TRUE 或 两 者 都 为 TRUE， 则 该 表达 式 的 值 为 TRUE， 如 果 
E 和 都 为 FALSE， 则 该 表达 式 的 值 为 FALSE。 
(c) NOT 已 。 知 有 为 FALSE， 则 该 表达 式 的 值 为 TRUE， 知 为 TRUE 则 其 值 为 FALSE。 
也 就 是 说 ， 逻 辑 表达 式 可 以 用 二 元 中 绥 表 达 式 AND 和 0OR， 以 及 一 元 前 绥 表 达 式 NOT 构 建 。 
与 其 他 代数 一 样 ， 我 们 需要 用 括号 进行 组 合 ， 不 过 在 某 些 情况 下 ， 也 可 以 利用 运算 符 的 优先 级 
和 结合 性 消除 多 余 的 括号 对 ， 正 如 我 们 在 涉及 这 些 逻 辑 运 算 符 的 C 语 言 条 件 表 达 式 中 所 做 的 那 
样 。 在 12.4 节 中 ， 将 看 到 出 现在 逻辑 表达 式 之 外 的 更 多 逻辑 运算 符 。 


+ 示例 12.1 
下 面 是 一 些 逻 辑 表达 式 的 例子 


(1) TRUE 





(2) TRUE OR FALSE 

(3) NOT P 

(4) PPAND (9 OR7) 

(5) (9 AND p) OR (NOT p) 

在 这 些 表 达 式 中 ，p、gq 和 rx 都 是 命题 变量 。 
12.3.1 ”逻辑 运算 符 的 优先 级 

与 其 他 类 型 的 表达 式 一 样 ， 我 们 也 可 以 为 逻辑 运算 符 指定 优先 级 ， 而 且 可 以 利用 这 样 的 优 
先 级 消除 某 些 括号 对 。 我们 已 经 看 到 的 这 些 逻 辑 运 算 符 的 优先 次 序 分 别 是 NOT ( 最 高 ), 然后 是 
AND， 再 是 oOR ( 最 低 ),。 虽然 我 们 将 会 看 到 AND 和 oR 具有 结合 性 ， 怎 样 分 组 都 无 关 紧 要 , 但 它们 
通常 是 从 左 组 合 的 。 而 一 元 前 缀 运算 符 NoOT 只 能 从 右 起 分 组 。 


+ 示例 12.2 

NOT NOT p OR g 被 分 组 为 (NOT (NOTp)) OR gu。 而 NOTp ORgq ANDr 被 分 组 为 (NOT p) OR (gq AND 
站。 大 家 应 该 可 以 看 出 ，AND、OR 和 NOT 的 优先 级 和 结合 性 与 算术 运算 符 x 、+ 和 一 元 的 -之 间 存 
在 相似 性 。 例 如 ， 本 例 所 述 的 第 二 个 表达 式 就 可 以 类 比 为 算术 表达 式 -p+gxr ， 它 有 着 相同 的 
分 组 方式 ，(-p)+(gxr)。 


12.3.2 ”逻辑 表达 式 的 求 值 


当 逻 辑 表 达 式 中 的 所 有 命题 变量 都 被 赋予 真 值 时 ， 表 达 式 本 身 也 得 到 一 个 真 值 。 我 们 可 以 
像 为 算术 表达 式 或 关系 表达 式 求 值 那样 ， 为 逻辑 表达 式 求 值 。 

这 一 过 程 通过 对 应 逻辑 表达 式 的 表达 式 树 可 以 得 到 最 好 的 体现 。 图 12-1 就 是 对 应 逻辑 表达 
式 p AND (gq OR 7) OR s 的 表达 式 树 。 给 定 某 一 真 值 赋 值 ， 也 就 是 ， 为 各 变量 赋值 TRUE 或 FALSE， 
可 以 从 表示 原子 操作 数 的 叶子 节点 开始 。 每 个 原子 操作 数 要 么 是 逻辑 常量 TRUE 或 FALSE 之 一 ， 
要 么 是 根据 真 值 赋值 给 定 了 TRUE 或 FALSE 之 中 某 一 个 值 的 变量 。 然 后 向 上 处 理 该 表达 式 树 。 一 
且 某 内 部 节点 > 的 子 节点 的 值 已 知 ， 就 可 以 对 这 些 值 应 用 处 在 节点 v 的 运算 符 ， 并 为 节点 v 产 生 真 
值 。 根 节点 的 真 值 就 是 整个 表达 式 的 真 值 。 


























图 12-1 表示 逻辑 表达 式 p AND (g OR7) OR s 的 表达 式 树 


+ 示例 12.3 

假设 要 为 表达 式 p AND (gq OR7) OR s 求 值 ， 其 中 p、gq、r 和 s 的 真 值 赋值 分 别 是 TRUE 、FALSE、 
TRUE 和 FALSE。 我 们 首先 要 考虑 图 12-1 中 最 低 的 内 部 节点 ， 也 就 是 表示 表达 式 g OR 1 的 内 部 节 
点 。 因 为 9 为 FALSE ， 而 /为 TRUE， 所 以 g OR 7 的 值 为 TRUE。 

现在 来 处 理 带 有 AND 运 算 符 的 节点 。 它 的 两 个 子 节点 分 别 对 应 表达 式 p 和 4 OR r， 因 此 都 具 
有 值 TRUE。 所 以 表示 表达 式 p AND (gq OR 门 的 该 节点 的 值 也 是 TRUE。 

最 后 ， 我 们 要 继续 处 理 带 有 运算 符 OR 的 根 节点 。 我 们 已 经 得 出 它 的 左 子 节 点 的 值 为 TRUE ， 
而 它 的 右 子 节点 表示 表达 式 s 根 据 真 值 赋值 其 值 为 FALSE。 因 为 TRUE OR FALSE 求 出 的 值 是 
TRUE， 所 以 整个 表达 式 的 值 为 TRUE。 


12.3.3 布尔 函数 

任何 表达 式 的 “含义 ”都 可 以 描述 为 从 其 参数 的 值 到 整个 表达 式 的 值 的 函数 。 例 如 ， 算术 
表达 式 xx(x+y) 是 接受 x 和 y (假如 x 和 y 是 实数 ) 的 值 ， 然 后 返回 将 两 个 参数 相 加 并 将 和 乘 以 第 
一 个 参数 所 得 到 的 值 。 这 一 行为 就 类 似 如 下 C 语 言 函数 的 行为 


float foo(float x, float y) 
t 














return x*(x+y); 


: 

在 第 7 章 中 我 们 了 解 到 ， 函 数 是 定义 域 和 值 域 有 序 对 的 集合 。 我 们 还 可 以 把 xx(x+y) 这 样 
的 算术 表达 式 表示 为 定义 域 为 实数 对 日 值 域 为 实数 的 函数 ,该 函数 是 由 形 如 ((x,y),xx(x+y)) 的 
有 序 对 构成 的 。 请 注意 ， 各 有 序 对 的 第 一 个 组 分 本 身 也 是 有 序 对 (x , y)。 该 集合 是 无 限 集 ， 它 所 
含 的 成 员 类 似 ((3,4),21) 或 ((10,12,5),225) 。 

类 似 地 ,逻辑 表达 式 的 含义 就 是 接受 真 值 赋 值 作 为 参数 , 并 返回 TRUE 或 FALSE 的 困 数 。 这 
样 的 函数 就 叫 作 布尔 函数 。 例 如 ， 逻 辑 表 达 式 

E: DAND(DOR gq) 
就 类 似 如 下 C 语 言 函 数 

BOOLEAN foo(BOOLEAN p, BOOLEAN dq) 

{ 








return p && (p || q); 
} 


和 算术 表达 式 一 样 ， 布 尔 表 达 式 也 可 以 视 作 有 序 对 的 集合 。 各 有 序 对 的 第 一 个 组 分 是 一 种 
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真 值 赋 值 ， 也 就 是 以 某 指 定 次 序 为 各 命题 变量 给 出 真 值 的 元 组 。 而 该 有 序 对 的 第 二 个 组 分 是 表 
达 式 对 应 此 真 值 赋值 时 的 值 。 


+ 示例 12.4 

表达 式 B =p AND (p oR gq) 可 以 用 由 4 个 成 员 组 成 的 函数 表示 。 我 们 在 表示 真 值 时 会 把 对 应 p 
的 值 放 在 对 应 gq 的 值 之 前 。 那么 ((TRUE,FALSE),TRUE) 就 是 将 BE 表示 为 函数 的 集合 中 的 一 个 有 序 
对 。 它 的 含义 是 ， 当 z 为 真 量 9 为 假 时 ，P AND (p oR 9) 为 真 。 我 们 可 以 通过 示例 12.3 中 所 示 的 过 
程 处 理 表示 E 的 表达 式 树 来 确定 该 值 。 读者 可 以 使 用 其 他 3 种 真 值 赋值 为 6 求 值 ， 以 此 构建 起 FE 所 
表示 的 整个 布尔 函数 。 


12.3.4 “习题 


(1) 针对 所 有 可 能 的 真 值 赋 值 ， 为 以 下 表达 式 求 值 ， 从 而 将 它们 的 布尔 函数 表示 成 集合 论 函数 。 


(a) p AND (p OR 9) 
(b) NOTP OR 9 
(c) (p AND gq) OR (NOTP AND NOT gq) 


(2) 编写 C 语 言 函 数 实现 习题 (D) 中 的 逻辑 表达 式 。 
12.4 ” 真 值 表 


将 布尔 函数 表示 为 真 值 表 是 很 方便 的 , 真 值 表 中 的 各 行 对 应 着 各 参数 真 值 所 有 可 能 的 组 合 。 
表 中 有 着 对 应 各 参数 的 列 以 及 对 应 函数 值 的 列 。 




















pg | pANDg p ga pORg p | NOTp 
0 0 0 0 0 0 0 1 
0 1 0 0 1 1 上 0 
1 0 0 1 0 1 
1 1 1 1 1 1 


图 12-2” 对 应 AND、0R 和 NOT 的 真 值 表 


+ 示例 12.5 

对 应 AND、OR 和 NoT 的 真 值 表 如 图 12.2 所 示 。 这 里 用 到 了 简略 表示 法 ， 用 1 代表 TRUE， 用 0 
代表 FALSE， 本 章 其 他 部 分 也 将 经 常 这 样 表示 。 因 此 对 应 AND 的 真 值 表 就 表示 ， 当 且 仅 当 两 个 
操作 数 都 为 TRUE 时 ， 结 果 才 是 TRUE， 而 第 二 个 真 值 表 则 表示 ， 当 操作 数 有 一 个 为 TRUE 或 两 个 
都 为 TRUE 时 ， 应 用 oOR 运 算 符 的 结果 为 TRUE ， 而 第 三 个 真 值 表 说 明 ， 当 且 仅 当 操作 数 的 值 为 
FALSE 时 ， 应 用 NoT 运 算 符 的 结果 为 TRUE。 


12.4.1 真 值 表 的 大 小 


假设 某 布 尔 函 数 具 有 k 个 参数 ， 那 么 该 函数 的 真 值 赋值 就 是 具有 k 个 元 素 的 表 ， 各 元 素 要 人 么 
为 TRUE， 要 人 么 为 FALSE。 计 算 对 应 k 个 变量 的 真 值 赋值 数 就 是 4.2 节 中 考虑 过 的 为 分 配 计数 问题 
的 例子 。 也 就 是 说 , 我们 可 以 为 这 k 个 项 每 个 项 分 配 两 个 真 值 之 一 。 这 就 和 用 两 种 可 选 闫 色 粉 刷 
k 所 房屋 的 问题 是 类 似 的 ， 因 此 真 值 赋值 的 数目 是 2 。 




















上 
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因此 含 £ 个 参数 的 布尔 函数 对 应 的 真 值 表 有 2 行 ， 每 一 行 都 对 应 一 种 真 值 赋值 。 例 如 ， 如 
果 k=2， 则 真 值 表 有 4 行 , 分 别 对 应 00、01、10 和 11， 正 如 我 们 在 图 12-2 中 看 到 的 对 应 AND 和 OR 
的 真 值 表 那 样 。 

尽管 涉及 两 三 个 变量 的 真 值 表 相当 小 。 但 /元 函数 对 应 关 行 这 一 事实 说 明 ， 不 用 等 到 k 变 得 
特别 大 ,绘制 真 值 表 就 会 很 难 了 。 例 如 , 含 10 个 参数 的 函数 就 有 逾 1000 行 。 在 后 面 几 节 中 我 们 还 
将 了 解 到 ,尽管 真 值 表 是 有 限 的 ,而 且 原 则 上 讲 可 以 表示 出 我 们 想 知道 的 与 布尔 函数 有 关 的 一 切 ， 
但 它们 呈 指 数 式 增长 的 大 小 通常 迫使 我 们 寻找 其 他 理解 、 比 较 布 尔 也 数 或 为 其 求 值 的 方法 。 

















理解 “蕴涵 ” 
蕴涵 (implication ) 运算 符 一 的 含义 可 能 不 那么 直观 ， 因 为 必须 利用 到 “ 假 竟 涵 一 切 ” 的 
概念 。 我 们 不 应 该 把 一 和 因果 关系 混为一谈 。 也 就 是 说 , p 一 gq 可 能 为 真 ， 但 p 并 不 是 在 任何 情 
况 下 都 会 “导致 ”9qg。 例 如 ， 设 p 是 “天 在 下 雨 ”，9g 是 “ 苏 带 着 伞 "” 。 我 们 可 以 断言 D 一 9 为 真 。 
而 且 看 起 来 似乎 就 是 下 雨 导致 苏 带 上 她 的 伞 。 不 过 ,也 有 可 能 苏 是 那 种 不 相信 天 气 预 报 而 且 不 
会 一 直 带 上 雨伞 出 门 的 人 。 





12.4.2 布尔 函数 数量 的 计算 


含 Kk 个 参数 的 布尔 函数 对 应 真 值 表 的 行 数 是 以 f 星 指 数 增长 的 , 而 不 同 克 布尔 函数 的 数量 增 
长 得 更 快 。 要 计算 kK 元 布尔 函数 的 数量 ,可 以 注意 到 ， 正 如 我 们 所 见 ， 每 个 这 样 的 函数 都 是 由 具 
有 关 行 的 真 值 表 表示 的 。 每 一 行 都 会 被 赋予 一 个 值 ， 要 么 为 TRUE， 要 么 是 FALSE。 因 此 ， 含 上 
个 参数 的 布尔 函数 的 数量 就 与 具有 2 个 值 的 2* 项 的 分 配 的 数量 相同 。 这 一 数字 是 2”。 例如 ， 当 
k=2 时 ,就 有 2? =16 个 函数 ， 而 对 上 =5 ， 存 在 2 =22 ， 或 者 说 是 大 约 40 亿 个 函数 。 

在 含 两 个 参数 的 16 种 布尔 函数 中 ， 我 们 已 经 遇 到 过 其 中 的 两 个 : AND 和 OR。 其 他 一 些 函数 
中 有 些 是 微不足道 的 ， 比 如 不 管 参数 为 什么 值 都 为 1 的 函数 。 不过, 还 有 一 些 双 参 数 函 数 是 很 实 
用 的 ， 而 且 我 们 将 在 本 节 之 后 的 内 容 中 看 到 它们 。 我 们 还 看 到 了 实用 的 单 参数 孔 数 NoOT， 而 且 
大 家 也 经 常会 用 到 具有 3 个 或 更 多 参数 的 布尔 函数 。 

12.4.3 更 多 逻辑 运算 符 
还 有 以 下 4 种 双 参 数 的 布尔 函数 是 非常 实用 的 。 
(1) 蕴涵 (implication )， 写 为 一 。 一 9 的 含义 是 ,“ 如 果 p 为 真 ， 那么 gq 为 真 。 对 应 一 的 真 


值 表 如 图 12-3 所 示 。 请 注意 ， 只 有 在 p 一 定 为 真 而 且 g 一 定 为 假 的 情况 下 , p 一 gq 才 可 以 为 假 。 如 
果 p 为 假 ， 那 么 p 一 9g 恒 为 真 ， 而 且 如 果 9 为 真 ， 则 p 一 q 恒 为 真 。 






































OO OI 
rs | 


Dp 
0 
0 
1 
1 


图 12-3 ”对 应 “蕴涵 ”的 真 值 表 
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(2) 等 价 (equivalence )， 写 为 = ， 意 思 是 “ 当 且 仅 当 ”， 即 只 有 当 p 和 g 都 为 真 或 都 为 假 时 ， 才 
有 p=dg。 它 的 真 值 表 如 图 12-4 所 示 。 另 一 种 看 待 = 运 算 符 的 方式 是 ， 它 表明 左边 和 右边 的 操作 数 具 
有 相同 的 真 值 。 这 就 是 12.2 节 中 我 们 在 声称 p OR((NoT p) AND q)=(p OR 9) 时 所 要 表达 的 意思 。 

(3) NAND 运 算 符 ， 或 者 说 “与 非 ”运算 符 ， 是 首先 对 操作 数 应 用 AND， 然 后 对 得 到 的 结果 
应 用 NoT 运 算 符 求 补 。p NAND 4 就 表示 NoT (p AND gq)。 

(4) 类 似 地 ，NOR 运 算 符 , 或 者 说 “或 韭 ” 运 算 符 ， 是 先 对 操作 数 取 oR， 然 后 对 得 到 的 结 
求 补 ，p NOR g 就 表示 NOT (p OR gq)。NAND 和 NOR 的 真 值 表 也 如 图 12-4 所 示 。 


DNAND 0 DNORO 





FS ES 


pd p 
0 0 0 
0 1 0 
1 0 1 
1 1 1 





图 12-4 ”对 应 等 价 、NAND 和 NOR 的 真 值 表 


12.4.4 ”具有 多 个 参数 的 运算 符 


一 些 逻 辑 运算 符 可 以 自然 地 扩展 为 接受 两 个 以 上 参数 ,例如 , 不 难看 出 AND 是 有 结合 性 的 ， 
也 就 是 (p AND 9) AND 7 等 价 于 p AND (q AND 7)。 因 此 ， 形 如 pi AND ps AND…AND px 的 表达 式 能 以 任 
意 次 序 组 合 ， 只 有 在 p1、p;,、…、pi 痢 为 真 TRUE 时 ， 它 的 值 才 为 TRUE。 因 此 我 们 可 以 把 该 表达 
式 写 为 具有 k 个 参数 的 函数 

AND(p1 , p2 ，… , Pp 
它 的 真 值 表 如 图 12-5 所 示 。 正 如 我 们 所 见 ， 只 有 在 所 有 参数 都 是 1 时 ， 结 果 才 是 1。 








D1 Pp2 +::* Pk-1 Pk | AND (pi1,p2,..., Pk) 
0 0 0 0 0 
0 0 0 1 0 
0 0 1 0 
0 0 I 0 
LT 1 0 0 
1 1 TO 1 


图 12-5 ”对 应 参数 AND 的 真 值 表 





一 些 运算 符 的 重要 性 
我 们 对 Kk 元 运算 符 AND、OR、NAND 和 NOR 特 别 感 兴趣 的 原因 在 于 ， 这 些 运 算 符 是 特别 容易 以 
电子 形式 实现 的 。 也 就 是 说 , 它们 是 构建 “ 门 ”( 接受 个 输入 并 产生 这 些 输入 的 AND、OR、NAND 
和 NOR 的 电子 电路 ) 的 简单 方式 。 尽 管 底层 电子 技术 的 细节 不 在 本 书 要 介绍 的 范围 之 内 ,但 其 思 
路 通俗 来 说 ， 就 是 用 两 种 不 同 的 电压 表示 1 和 0 ( 即 TRUE 和 FALSE )。 其 他 一 些 运算 符 ， 比 如 三 和 
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一 ， 就 不 是 很 容易 用 电子 方式 实现 ， 而 我 们 一 般 会 使 用 若干 个 NAND 或 NOR 门 来 实现 它们 。 不 过 ， 
NOT 运 算 符 既 可 看 作 单 参数 的 NAND， 也 可 看 作 单 参数 的 NOR， 因 此 也 是 “很 容易 ”实现 的 。 





同样 ，OR 也 是 具有 结合 性 的 ， 我 们 可 以 把 逻辑 表达 式 Pi OR p， OR … OR Pi 表示 成 布尔 函数 
OR (1D2PDD。 对 应 DECOR 的 真 值 表 有 和 关 行 ， 就 像 训 CAND 的 真 值 表 那样 。 不 过 ， 对 这 一 ECOR 
的 真 值 表 来 说 ,只 有 pi1、p;，、…、px 都 被 赋值 为 0 的 第 一 行 的 值 才 是 0, 而 其 余 关 -1 行 的 值 全 为 1。 

二 元 运算 符 NAND 和 NOR 是 可 交换 但 不 可 结合 的 。 因 此 pi NAND ps NAND…NAND px 这 个 不 含 插 
号 的 表达 式 是 没有 固有 含义 的 。 在 讲 到 已 ENAND 时 ， 并 不 表示 

DPI NAND p; NAND…NRAND pi 
任何 可 能 的 分 组 。 而 是 把 NAND (pi1,p2,…,pD) 定 义 为 

NOT (p1 AND p> AND…'AND pi) 
也 就 是 说 ， 只 有 在 pi 、p;、…、p4 的 值 都 为 1 时 ，NAND (p1,p2…;p) 的 值 才 是 0, 对 其 他 2* -1 种 输入 
组 合 而 言 ， 其 值 都 为 1。 

同样 ，NOR(p1,p;…,pD) 表 示 NOT (pi OR ps OR…ORpp)。 只 有 在 p1、p;、…、p4 的 值 全 部 是 0 时 , 它 
的 值 才 是 1， 否 则 它 的 值 为 0。 


12.4.5 “逻辑 运算 符 的 结合 性 与 优先 级 
我 们 将 用 到 的 优先 级 次 序 是 


(1) NoT (最 高 ) 

(2) NAND 

(3) NOR 

(4) AND 

(9) OR 

(0) 一 

(7) = (最 低 ) 
因此 ， 举 例 来 说 ，p 一 p=NOT p OR 被 分 组 为 (p 一 p)=((NOT p)OR gq)。 

正如 我 们 之 前 提 过 的 ，AND 和 oR， 以 及 = ， 都 是 具有 结合 性 和 交换 性 的 。 如 果 有 必要 指定 
的 话 , 一 般 会 假设 它们 是 从 左 起 组 合 的 。 我 们 一 般 会 明确 地 给 出 括号 ， 以 防 出 现 疏 义 , 不 过 一 、 
NAND 和 NOR 这 样 的 运算 符 在 两 个 或 多 个 相同 运算 符 组 成 的 串 中 都 是 从 左 起 组 合 的 。 


12.4.6 ”利用 真 值 表 为 逻辑 表达 式 求 值 


只 要 表达 式 E 中 不 含 太 多 变量 , 利用 真 值 表 针 对 所 有 可 能 的 真 值 赋值 计算 和 展示 E 的 值 就 是 
一 种 方便 的 方法 。 我 们 首先 有 对 应 E 中 各 变量 的 列 ， 然 后 是 按照 从 下 到 上 为 E 的 表达 式 树 求 值 的 
次 序 对 应 BZ 各 子 表 达 式 的 列 。 

在 对 表示 某 些 节点 的 值 的 列 应 用 运算 符 时 ， 我 们 会 用 一 种 简单 的 方式 为 对 应 该 运算 符 的 列 
执行 运算 。 例如 ,如果 和 希望 对 两 列 取 AND, 就 在 两 列 都 为 1 的 那 行 中 放 上 1, 并 在 其 他 行 中 放 上 0。 
要 是 为 两 列 求 OR， 就 要 在 其 中 一 列 或 者 两 列 都 为 1 的 那 几 行 中 放 上 1， 并 在 其 他 行 中 放 上 0。 如 
果 要 为 一 列 取 NoT ， 就 是 为 该 列 求 补 ， 如 果 那 列 有 0， 则 放 上 1， 最 后 再 举 个 例子 ， 
对 两 列 应 用 一 运算 符 , 只 有 在 第 一 列 为 1 且 第 二 列 为 0 时 , 其 结果 才 是 0, 结果 中 的 其 他 各 行 都 是 1。 

其 他 一 些 运 算 符 的 规则 留 作 本 节 习 题 。 一 般 而 言 ， 我 们 会 通过 一 行 行 地 对 所 在 行 中 各 值 应 
用 运算 符 ， 以 对 各 列 应 用 运算 符 。 
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+ 示例 12.6 

考虑 表达 式 E:(p AND 9) 一 (p 0R 7)。 图 12-6 给 出 了 对 应 该 表达 式 及 其 子 表达 式 的 真 值 表 。 
(1)、(2)、(G3) 这 3 列 给 出 了 变量 p、g 和 x 的 值 的 所 有 组 合 。 第 (4) 列 给 出 了 子 表 达 式 p AND gq 的 值 ， 
只 要 第 (1) 和 第 (2) 列 的 值 都 是 1， 该 列 的 值 就 是 1。 而 第 (5) 列 给 出 了 子 表 达 式 p oR 7 的 值 ， 在 第 (]) 
列 或 第 (3) 列 为 1, 或 者 第 (1) 和 第 (3) 列 都 为 1 时 ,第 (5) 列 的 值 是 1。 最 后 ,第 (6) 列 表示 整个 表达 式 
E 的 值 。 它 是 通过 第 (4) 和 第 (5) 列 得 到 的 ， 除了 第 (4) 列 为 1 目 第 (5) 列 为 0 的 情况 外 ， 这 列 的 值 都 是 
1。 因 为 不 存在 这 样 的 行 ， 所 以 第 (6) 行 全 是 1， 也 就 是 说 不 管 参数 是 什么 ，E 的 真 值 都 是 1。 正 如 
我 们 将 在 12.7 节 中 看 到 的 ， 这 样 的 表达 式 称 为 “ 重 言 式 ”。 











(1) (2) (3) (9 (5) (6) 
了 q 人 pANDg DOR7 EF 
0 0 0 0 0 1 
0 0 1 0 1 1 
0 1 0 0 0 1 
0 1 1 0 1 1 
1 0 0 0 1 1 
1 0 1 0 1 1 
1 1 0 1 1 1 
1 1 1 1 1 1 


图 12-6 ”对 应 (p AND 9) 一 (p OR 的 真 值 表 





文 氏 图 和 真 值 表 


真 值 表 与 7.3 节 中 讨论 过 的 表示 集合 运算 的 文 民 图 之 间 存 在 着 相似 性 。 首 先 ， 并 集运 算 就 类 似 
于 真 值 的 OR， 而 交集 则 类 似 RAND。 我 们 将 在 12.8 节 中 看 到 ， 这 两 对 运算 满足 相同 的 代数 法 则 。 就 像 
涉及 kk 个 集合 作为 参数 的 表达 式 会 把 文 民 图 分 成 2" 个 区 域 那样 ， 具 有 K 个 变量 的 还 辑 表 达 式 也 会 形 
成 具有 2 行 的 真 值 表 。 此 外 ， 在 这 些 区 域 与 这 些 真 值 表 行 之 间 也 存在 自然 的 对 应 。 例 如 ， 具 有 变 
量 p、q 和 1 的 逻辑 表达 式 就 对 应 涉及 P、QO 和 RR 这 3 个 集合 的 集合 表达 式 。 考虑 对 应 这 些 集合 的 文 民 图 : 





人 
/XN 








在 这 里 ， 区 域 0 对 应 不 在 P、QO、R 任 意 一 个 中 的 元 素 构 成 的 集合 。 区 域 1 则 对 应 着 在 R 中 但 
不 在 P 或 DO 中 的 元 素 。 一 般 地 讲 ， 如 果 考 虑 3 位 区 域 编 号 的 二 进 制 表示 ， 比 方 说 是 apc， 那 么 如 
果 a=1， 则 表示 元 素 在 P 中 ,如 果 bp=1 则 在 QO 中, 而 如 果 c=1 则 在 R 中 。 因此, 编号 为 (abc), 的 
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区 域 就 对 应 着 p、g、r 分 别 具 有 真 值 a、b、c 时 真 值 表 的 那 行 。 

在 处 理 文 氏 图 时 ， 表示 两 个 集合 并 集 的 区 域 会 包含 对 应 两 者 中 任 一 集合 的 区 域 。 与 此 相似 
的 是 ， 在 为 真 值 表 中 的 列 求 OR 时 ， 我 们 会 在 第 一 列 有 1 的 行 与 第 二 列 有 1 的 行 的 并 集中 放 上 1。 
类 似 地 ， 文 氏 图 中 表示 集合 交集 的 区 域 就 是 只 取 重 在 这 两 个 集合 中 的 区 域 ， 而 为 列 求 AND 就 是 
在 第 一 列 有 1 的 行 与 第 二 列 有 1 的 行 的 交集 中 放 上 1。 

这 辑 运算 符 NOT 与 集合 运算 符 没有 太 多 对 应 。 不 过 ， 如 果 将 所 有 区 域 的 并 集 想 象 成 个 “全 
集 "， 那 么 逻辑 NOT 对 应 着 取 走 一 些 区 域 ， 并 生成 文 氏 图 中 剩余 区 域 组 成 的 集合 ， 也 就 是 从 全 集 
中 减 去 给 定 的 集合 。 





12.4.7 “习题 


(1) 给 出 计算 真 值 表 中 两 列 的 (a) NAND; (b) NOR; (c)= 的 规则 。 
(2) 为 以 下 表达 式 及 它们 的 子 表达 式 计算 真 值 表 。 

(a) (pq9)=(NOT p OR g) 

(b) p> (g(r OR NOT p)) 

(co) (p OR q9) > Wp AND 9) 

(3) * 逻辑 表达 式 p AND NOT gq 对 应 什么 集合 运算 符 ?( 见 之 前 比较 文 氏 图 和 真 值 表 的 短文 。) 

(4)* 给 出 说 明 一 、NAND 和 NOR 不 具 结 合 性 的 例子 。 

(5) ** 如 果 布 尔 函 数 / 丹 足 FTRUE ,oo …, X00) = 了 (FALSE ,x2,X3…, XD)， 则 说 得 不 依赖 第 一 个 参数 的 。 
同样 ， 如 果 有 -的 第 i 个 参数 在 TRUE 和 FALSE 之 间 变 换 却 不 会 使 的 值 改变 ， 就 可 以 说 是 不 依赖 第 i 个 参 
数 的 。 有 多 少 双 参 数 布尔 函数 是 不 依赖 它们 的 第 一 个 或 第 二 个 参数 〈 或 两 个 参数 都 不 依赖 ) 的 ? 

(6) * 为 具有 两 个 变量 的 16 种 布尔 函数 构建 真 值 表 。 这 些 函 数 中 有 多 少 种 具有 交换 性 ? 

(7) 二 元 异 或 〈exclusive-or ) 函数 日 的 定义 是 ， 当 且 仅 当 只 有 其 中 一 个 参数 为 TRUE 时 其 值 为 TRUE。 
(a) 画 出 @ 的 真 值 表 。 

(b) 人 @ 是否 具 有 交换 性 ? 它 是 否 具 有 结合 性 ? 


12.5 ”从 布尔 函数 到 逻辑 表达 式 


现在 考虑 从 真 值 表 设 计 逻 辑 表达 式 的 问题 。 从 作为 逻辑 表达 式 规 范 的 真 值 表 开 始 ， 目 标 则 
是 找到 具有 给 定 真 值 表 的 表达 式 。 一 般 而 言 ， 可 以 利用 无 数 个 不 同 的 表达 式 ， 我 们 往往 将 选择 
限制 到 特定 的 运算 符 集 合 中 ， 而 且 通 常会 希望 表达 式 从 菏 种 意义 上 讲 是 “最 简单 的 ”。 
该 问题 是 电路 设计 中 的 基础 问题 。 表 达 式 中 的 逻辑 运算 符 可 以 被 理解 成 电路 的 门 ， 这 样 的 
话 就 存在 从 逻辑 表达 式 到 电子 电路 的 直接 转化 ， 这 种 转化 是 通过 第 13 草 将 要 讨论 的 过 程 实现 的 。 
2 y 











之 


图 12-7 一 位 加 法 器 : (dz), 是 x+y+c 的 和 
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+ 示例 12.7 

正如 我 们 在 1.3 节 中 看 到 的 ， 可 以 用 图 12-7 所 示 的 这 种 一 位 加 法 器 设计 32 位 加 法 器 。 一 位 加 
法 器 会 把 两 个 输入 位 x 和 ?7 与 进位 输入 位 c 相 加 ， 得 到 进位 输出 位 d 与 和 值 位 z。 

图 12-8 中 的 真 值 表 给 出 了 进位 输出 位 4d 与 和 值 位 z 的 值 , 将 其 表示 为 对 应 8 种 输入 值 组 合 的 x、 
y、cC 的 函数 。 如 果 x、y 和 和 c 中 至 少 有 两 个 的 值 是 1， 进 位 输出 位 4 就 是 !， 而 只 有 在 输入 中 没有 1 或 
者 只 有 一 个 1 时 ， 才 有 d= 0。 如 果 x、y 和 c 中 有 奇数 个 为 1， 和 值 位 z 就 是 1， 否 则 就 是 0。 














x y 4 qd Zz 
0) 0 0 0 0 0 
1) 0 0 1 0 1 
2) 0 1 0 0 1 
3) 0 1 1 1 0 
4) 1 0 0 0 1 
5) 1 0 1 1 0 
6) 1 1 0 1 0 
7) 1 1 1 1 1 








图 12-8 ”对 应 进位 输出 位 4 与 和 值 位 z 的 真 值 表 


我 们 要 展示 一 种 从 真 值 表 立 即 转换 成 逻辑 表达 式 的 一 般 性 方法 。 不 过 ， 给 定 图 12-8 中 进位 
输出 函数 4 的 情况 下 ， 可 以 按照 如 下 方式 进行 推理 ， 构 建 对 应 的 逻辑 表达 式 。 

(1) 从 第 3 行 和 第 7 行 可 知 ， 如 果 y 和 c 都 是 1， 则 4d 是 1。 

(2) 从 第 5 行 和 第 7 行 可 知 ， 如 果 x 和 c 都 是 1， 则 4 是 1。 

(3) 从 第 6 行 和 第 7 行 可 知 ， 如 果 x 和 y 都 是 1， 则 a 是 1。 
条 件 (D) 可 以 用 逻辑 表达 式 > AND cc 模拟， 因为 y AND c 只 有 在 y 和 c 都 是 1 时 才 为 真 。 同 样 ， 条 件 (2) 
可 以 用 x AND c 模 拟 ， 而 条 件 (3) 则 可 通过 x AND y 模 拟 。 

所 有 有 d= 1 的 行 都 是 这 3 种 情况 中 的 某 一 行 。 因 此 可 以 写 出 一 个 逻辑 表达 式 ， 它 只 要 在 这 3 
个 条 件 中 至 少 有 一 个 成 立 的 情况 下 为 真 即 可 ， 也 就 是 要 为 这 3 个 表达 式 取 逻 辑 OR: 

(y AND c) OR (x AND c) OR (x AND y) (12.5) 

这 一 表达 式 的 正确 性 在 图 12-9 中 得 到 了 验证 ,后 4 列 分 别 对 应 子 表 达 式 y AND cx AND Cc 、x AND 

y 和 表达 式 (12.5)。 























图 12-9 ”对 应 进位 输出 表达 式 (12.5) 及 其 子 表达 式 的 真 值 表 


12.5.1 简化 符号 
在 继续 描述 如 何 从 真 值 表 构 建 表达 式 之 前 ， 我 们 要 对 表示 法 进行 一 些 有 意义 的 简化 。 
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(1) 可 以 通过 直接 并 列 ( 也 就 是 不 使 用 任何 运算 符 ) 表示 AND 运 算 符 ， 就 像 表示 乘法 ， 以 及 
第 10 章 中 表示 串 接 时 那样 。 

(2) OR 运 算 符 可 以 表示 为 +。 

(3) NOT 运 算 符 可 以 用 上 横 线 表示 。 这 种 约定 在 NOT 应 用 到 单个 变量 上 时 特别 实用 ， 我 们 经 
常 把 NOT p 写 为 五 。 

+ 示例 12.8 

表达 式 p AND 4 OR 7 可 以 写 为 pg+r， 表 达 式 p AND NoT q OR NOT 7 则 可 以 写 为 pg9+7。 我 们 其 

至 可 以 将 原始 符号 与 简化 符号 混用 。 例 如 ， 表 达 式 
((p AND gq) 一 门 AND (ps) 
可 以 写成 (pg 一 7) AND (p 一 5s)， 其 至 可 以 写成 pq 一 7) (Dp 一 5s)。 

使 用 这 种 新 表示 法 的 一 个 重要 原因 在 于 ， 这 样 可 以 让 我 们 把 AND 和 oR 视 作 算术 运算 中 的 乘 
法 和 加 法 。 因 此 可 以 应 用 诸如 交换 律 、 结 合 律 和 分 配 律 这 样 的 类 似 法 则 ， 在 12.8 节 中 我 们 将 会 
看 到 这 些 法 则 适用 于 这 些 逻 辑 运算 符 ， 就 像 这 些 法 则 对 相应 的 算术 运算 符 所 做 的 那样 。 例 如 ， 
我 们 会 看 到 p(q+7) 可 以 被 pqtpr 蔡 换 , 然后 被 rptqp 蔡 换 , 不 管 涉 及 的 运算 符 是 AND 和 OR, 还 是 乘 
法 和 加 法 。 

因为 有 了 这 种 简化 符号 ， 通常 可 以 把 表达 式 的 AND 称 为 积 ， 把 表达 式 的 OR 称 为 和 。 表 达 式 
的 AND 也 可 以 称 为 合 取 ( conjunction )， 而 表达 式 的 OR 还 可 以 叫 作 析 取 ( disjunction )。 


12.5.2 ”从 真 值 表 构 建 逻 辑 表 达 式 


任何 布尔 困 数 都 可 以 用 使 用 AND、OR 和 No 运算 符 的 逻辑 表达 式 表 示 。 为 给 定 的 布尔 困 数 找 
到 最 简单 的 表达 式 一 般 是 很 难 的 。 不 过 ， 为 布尔 函数 构建 茶 一 表达 式 却 很 容易 ， 用 到 的 技巧 也 
很 简单 。 首 先 从 也 数 的 真 值 表 开始 ， 构 建 形 如 

m1 OR m2 OR***OR Mm, 

的 逻辑 表达 式 。 各 个 mj 都 是 与 真 值 表 中 让 函数 的 值 为 1 的 某 一 行 对 应 的 。 因 此 该 表达 式 中 项 数 与 
表示 孔 数 的 那 列 中 1 的 个 数 是 相等 的 。 这 些 mj 项 都 被 叫 作 最 小 项 ( minterm )， 并 具有 下 面 将 要 描 
述 的 特殊 形式 。 

要 开始 对 最 小 项 的 解释 ， 首 先 要 提 到 文字 (literal )， 这 里 的 文字 要 么 为 单个 命题 变量 ( 比 
如 p )， 要 么 为 求 反 变量 ( 比如 我 们 一 般 会 写 为 万 的 NoT p )。 如 果真 值 表 中 有 Kk 列表 示 变 量 的 列 ， 
那么 每 个 最 小 项 都 是 由 k 个 文字 的 逻辑 AND (或 “ 积 ”) 表示 的 。 设 r 是 我 们 想 为 其 构建 最 小 项 的 
某 一 行 。 如 果 变 量 p 在 行 的 值 是 1， 就 选择 文字 p。 如 果 p 在 行 ? 的 值 是 9， 则 选择 5 作为 文字 。 行 
7 的 最 小 项 就 是 各 变量 对 应 文字 的 积 。 明 确 地 讲 ， 如 果 所 有 变量 都 有 真 值 表 行 r 中 的 值 ， 那 么 最 
小 项 的 值 就 只 可 能 是 1。 

现在 要 通过 为 与 函数 值 为 1 的 行 对 应 的 最 小 项 求 逻 辑 0R ( 或“ 和”), 来 为 函数 构建 表达 式 。 
得 到 的 表达 式 具 有 “ 积 的 和 ”的 形式 ,或 者 说 它 是 析 取 范式 ( disjunctive normal form )。 该 表达 
式 是 正确 的 ， 因 为 只 有 在 存在 值 为 1 的 最 小 项 时 ， 它 的 值 才 是 1， 而 除非 变量 的 值 对 应 着 真 值 表 
中 该 最 小 项 所 在 的 那 行 ， 而 且 该 行 的 值 为 1， 和 否则 该 最 小 项 不 可 能 为 1。 


+ 示例 12.9 
我 们 来 为 由 图 12-8 中 的 真 值 表 所 定义 的 进位 输出 函数 4 构建 析 取 范式 。 值 为 1 的 行 的 编号 分 
别 是 3、5、6 和 7。 第 3 行 有 x= 1、y= 1 和 c= 1， 因 此 该 行 的 最 小 项 是 xX ANDyANDc， 可 以 将 其 简 
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写 为 了 yc 。 类 似 地 , 第 5 行 的 最 小 项 是 xc ,第 6 行 的 最 小 项 是 xye ， 而 第 7 行 的 最 小 项 是 xzyc。 
此 所 需 的 对 应 4 的 表达 式 就 是 这 些 表 达 式 的 逻辑 oOR， 也 就 是 
Xyc + XxXyc + XxXyc + xyc (12.6) 
这 一 表达 式 要 比 (12.5) 更 复杂 。 不 过 ， 我 们 将 在 12.6 节 中 看 到 如 何 得 出 表达 式 (12.5)。 
同样 ， 通 过 把 对 应 第 1、2、4 和 7 行 的 最 小 项 相 加 ， 可 以 为 和 值 位 z 构 建 逻 辑 表达 式 ， 得 到 





XyC+XyC+Xy C+Xxyc 





运算 符 的 完全 集 
用 来 设计 (12.6) 式 这 样 析 取 范式 的 最 小 项 技术 表明 ， 远 辑 运算 符 AND、OR 和 NOT 的 集合 是 
全 集 ， 就 是 说 ， 每 个 布尔 函数 都 具有 只 使 用 这 3 种 运算 符 的 表达 式 。 不 难 证 明 NAND 本 身 也 是 
全 的 。 我 们 可 以 将 涉及 AND、OR 和 NOT 的 函数 只 用 NAND 表 示 成 如 下 这 样 。 
(1) (p AND g)=((p NAND 9) NAND TRUE) 


人 > 
元 
> 
元 


(2) (p OR gq)=((p NAND TRUE ) NAND (9 NAND TRUE )) 

(3) (NoT p)=(p NAND TRUE) 

通过 用 合适 的 NAND 表 达 式 来 替换 用 到 AND、OR 和 NOT 的 地 方 ， 可 以 把 任何 析 取 范式 转换 
成 只 涉及 NAND 的 表达 式 。 同 样 ，NOR 自 身 也 是 完全 的 。 

由 运算 符 AND 和 OR 构成 的 集合 就 不 是 完全 集 。 上 比方 说 ， 它 们 没 法 表示 函数 NOT。 要 知道 原 
因 ， 我 们 可 以 注意 到 AND 和 OR 都 是 单调 的 ， 这 就 是 说 ， 在 把 任何 一 个 输入 从 0 变 为 1 时 ， 输 出 都 
不 能 从 1 变 成 0。 可 以 通过 对 表达 式 的 大 小 进行 归纳 ,证明 任何 只 有 AND 和 OR 运 算 符 的 表达 式 都 
是 单调 的 。 不 过 NOT 显 然 不 是 单调 的 ， 因 此 没 办 法 只 用 AND 和 OR 表示 NOT。 


CD es 
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1 
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图 12-10 用 于 习题 的 两 个 布尔 函数 


12.5.3 “习题 


(1) 图 12-10 是 用 变量 p、g 和 x 定义 4 和 b 这 两 个 布尔 函数 的 真 值 表 ， 为 这 两 个 函数 分 别 写 出 析 取 范式 。 
(2) 为 下 列 函 数 写 出 合 取 范式 ( 见 下 面 的 附注 栏 “ 和 的 积 表 达 式 ” ) 。 

(a) 图 12-10 中 的 函数 a。 

(b) 图 12-10 中 的 函数 b。 

(c) 图 12-8 中 的 函数 z。 


二 — 











和 的 积 表达 式 


有 两 种 方式 可 以 把 真 值 表 转换 成 涉及 AND、OR 和 NOT 的 表达 式 ， 这 里 的 表达 式 将 会 是 文字 之 和 ( 届 
辑 OR ) 的 积 (逻辑 AND ) 。 这 种 形式 就 叫 作 “和 的 积 ”， 或 合 取 范式 (conjunction normal form ) 。 

对 真 值 表 的 各 行 而 言 , 我 们 可 以 定义 最 大 项 , 它 是 与 所 在 行 中 某 一 参数 变量 的 值 不 相同 的 文字 的 和 。 
也 就 是 说 ， 如 果 该 行 中 变量 p 的 值 是 0， 就 使 用 文字 六 ， 如 果 那 行 中 pp 的 值 为 1， 就 使 用 万。 因此 ， 除 非 每 个 
变量 p 都 具有 该 行 指定 给 p 的 值 ， 否 则 最 大 项 的 值 就 是 1。 

因此 ， 如 果 查 看 真 值 表 中 值 为 0 的 各 行 ， 并 为 这 些 行 的 最 大 项 取 逻 辑 AND ， 该 表达 式 就 只 会 在 输入 
匹配 函数 值 为 0 的 某 一 行 时 值 为 0。 这 样 一 来 ， 该 表达 式 对 其 他 各 行 而 言 值 都 为 1， 也 就 是 对 真 值 表 中 函数 
值 为 1 的 那些 行 来 说 都 是 1。 例 如 ， 图 12-8 的 真 值 表 中 ， 第 0、1、2 和 4 行 对 应 d 的 值 为 0。 比 方 说 ， 第 0 行 的 
最 大 项 就 是 x+y+c ， 而 第 1 行 的 最 大 项 就 是 x+y+TE ， 所 以 d 的 合 取 范式 就 是 

(xX+y+c)(x+y+c)(x+y+c)(xX+y+c) 

该 表达 式 与 (12.5) 和 (12.6) 式 都 是 等 价 的 。 





(3) ** 以 下 哪个 逻辑 运算 符 可 以 单独 形成 运算 符 完 全 集 : (a)=;(25) 一 ;(c) NOR? 在 每 种 情况 中 都 对 目 
己 的 答案 加 以 证 明 。 

(4) ** 在 16 个 双 变 量 的 布尔 函数 中 ， 有 多 少 函数 自身 就 是 完全 的 ? 

(5)* 证 明 ， 单调 函数 的 AND 和 OR 还 是 单调 的 。 然 后 证 明 只 含 AND 和 oR 运算 符 的 表达 式 都 是 单调 的 。 


12.6 ”利用 卡 话 图 设计 远 辑 表达 式 


在 本 节 中 ， 我 们 要 展示 一 种 为 布尔 函数 确定 析 取 范式 的 制 表 技巧 。 用 这 种 方法 生成 的 表达 
式 通常 要 比 12.5 节 中 通过 为 真 值 表 中 所 有 必要 的 最 小 项 求 逻 辑 0R 这 样 的 权宜 之 计 所 构建 出 的 表 
达 式 更 简单 。 

举例 来 说 ， 在 示例 12.7 中 ， 我 们 为 一 位 加 法 恬 的 进位 输出 孔 数 对 应 的 表达 式 进行 了 专门 设 
计 。 可 以 看 到 ， 有 可 能 使 用 不 是 最 小 项 的 文字 之 积 ， 也 就 是 说 ， 缺 少 与 某 些 变量 对 应 的 文字 。 
例如 ， 可 以 用 文字 之 积 xy 来 涵盖 图 12-8 中 的 第 (6) 和 第 (7) 两 行 ， 因为 只 有 在 变量 x、y 和 c 具 有 这 两 
行 中 的 某 一 行 所 表示 的 值 时 ，xy 的 值 才 是 1。 

同样 ， 在 示例 12.7 中 ,我们 使 用 了 表达 式 xc 来 涵盖 第 (5) 和 第 (7) 行 ， 并 用 yc 涵盖 第 (3) 和 第 (7) 
行 。 请 注意 ， 所 有 3 个 表达 式 都 涵盖 了 第 7 行 。 不 过 这 并 没有 什么 坏人 处。 其实， 假如 分 别 只 使 用 
对 应 第 (5) 和 第 (3) 行 的 最 小 项 ， 也 就 是 xjc 和 yc ， 来 替代 xc 和 和 yc， 我们 会 得 到 正确 的 表达 式 ， 
但 它 就 要 比 示例 12.7 中 得 到 的 表达 式 xy+xc+ yc 多 两 个 运算 符 。 

这 里 的 基本 概念 就 是 ， 如 果 两 个 最 小 项 唯一 的 区 别 是 某 一 个 变量 的 值 相反 ， 比 如 第 (6) 和 第 
(7) 行 的 xyc 和 xc ， 就 可 以 通过 取 相 同 的 文字 并 去 挥 那 个 有 区 别 的 变量 ， 把 两 个 最 小 项 结合 起 
来 。 这 一 结论 遵从 以 下 一 般 法 则 





























(pg+ Pq)=4q 
要 理解 这 一 等 价 性 ， 就 要 注意 到 如 果 q 为 真 ， 那么 要 么 pg 为 真 。 要 人 么 Bq 为 真 。 而 且 反 过 来 ， 如 
果 pg 或 Bq 有 一 个 为 真 ， 那么 一 定 有 gq 为 真 。 
12.7 节 中 介绍 了 验证 这 些 法 则 的 技巧 ， 不 过 现在 只 要 其 直觉 含义 支撑 其 使 用 即 可 。 还 要 注 
意 到 ， 该 法 则 的 使 用 并 不 仅 限 于 最 小 项 。 例 如 ， 可 以 设 p 是 任意 命题 变量 ， 而 g 是 任意 的 文字 之 
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积 。 你 可 以 合并 任何 两 个 只 有 一 个 变量 不 同 的 文字 积 (一 个 积 含有 变量 本 里， 男 一 个 则 含有 其 
互补 变量 )， 用 由 相同 文字 组 成 的 一 个 积 代替 这 两 个 积 。 


12.6.1 卡 诺 图 


有 一 种 制图 技巧 , 可 以 根据 真 值 表 设计 析 取 范式 , 这 种 方法 对 最 多 含 4 个 变量 的 布尔 函数 来 
说 效果 其 佳 。 这 种 思路 就 是 把 真 值 表 写 成 名 为 卡 诺 图 ( Karnaugh map ) 的 二 维 数组 ， 该 二 维 数 
组 的 项 (或 者 说 “点 ”) 各 自 表示 真 值 表 中 的 行 。 通过 让 只 有 一 个 变量 不 同 的 行 所 对 应 的 点 保持 
邻接 ， 可 以 把 有 用 的 文字 积 看 作 某 些 矩形 ， 而 这 些 和 矩形 中 的 点 的 值 都 是 1。 


12.6.2” 双 变量 卡 诺 图 


最 简单 的 卡 庄 图 是 对 应 双 变 量 布尔 函数 的 。 各 行 对 应 着 其 中 一 个 变量 的 值 ， 而 各 列 对 应 为 
一 个 变量 的 值 。 图 中 的 项 是 0 或 1， 取 决 于 两 个 变量 值 的 组 合 使 函数 的 值 为 0 还 是 为 1!。 因 此 ， 该 
卡 诺 图 是 双 变 量 布尔 函数 真 值 表 的 二 维 表示 。 


+ 示例 12.10 

在 图 12-11 中 ， 我 们 看 到 表示 “蕴涵 ”本 数 p 一 g 的 卡 诺 图 。 其 中 4 个 点 分 别 对 应 着 p 和 gq 的 
值 4 种 可 能 的 组 合 。 请 注意 , 除了 p=1 有 是 g=0 的 情况 之 外 ,“ 蕴 涵 ” 的 值 都 是 1， 因 此 ， 卡 诺 图 
中 值 为 0 的 点 只 有 对 应 p=1 且 gqg =0 的 那 项 ， 其 他 点 的 值 都 是 1。 



































q 
0 1 
0 1 1 
p 
1 0 1 


图 12-11 表示 p 一 9g 的 卡 诺 图 


12.6.3” 强 酒 项 


布尔 函数 /的 蕴涵 项 〈implicant ) 是 一 些 文字 的 积 x， 它 满足 的 条 件 是 : /中 变量 的 任何 赋值 
组 合 都 不 能 使 z 为 真 且 /为 假 。 例 如 ， 每 一 个 让 函数 的 值 是 1 的 最 小 项 都 是 的 理 涵 项 。 不 过 ， 其 
他 积 也 可 以 是 蕴涵 项 ,我 们 将 会 了 解 如 何 从 的 卡 诺 图 中 解读 这 些 强 涵 项 。 


+ 示例 12.11 

最 小 项 pg 是 图 12-11 中 “蕴涵 ”也 数 的 蕴涵 项 ， 因 为 让 pg 为 真 的 变量 赋值 组 合 ( 即 p=1 有 量 
q =0 ) 也 能 使 “ 曾 涵 ”也 数 为 真 。 

再 举 个 例子 ， 五 本 上身 也 是 “ 列 涵 ” 柱 数 的 列 涵 项 ， 因 为 使 为 真 的 两 种 p 和 4 赋值 组 合 ， 也 能 
让 了 一 9 为 真 。 这 两 种 赋值 组 合 分 别 是 p=0 且 9g=0， 以 及 p=0 且 =1。 

蕴涵 项 涵盖 了 消 数 值 为 1 的 那些 点 。 通 过 为 涵盖 了 所 有 令 消 数值 为 1 的 点 的 缠 涵 项 取 OR， 就 
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可 以 为 布尔 函数 构建 逻辑 表达 式 。 


+ 示例 12.12 

图 12-12 展 示 了 对 应 “蕴涵 ”函数 的 卡 诺 图 中 的 两 个 蕴涵 项 。 较 大 的 那个 涵盖 了 两 个 点 ， 对 
应 着 单个 文字 万 。 这 一 蕴涵 项 涵盖 了 卡 诺 图 中 顶部 的 两 个 点 , 这 两 个 点 的 值 都 是 1。 而 较 小 的 草 
涵 项 pc 涵盖 了 P=1 且 4=1 的 那个 点 。 因 为 这 两 个 蕴涵 项 加 在 一 起 涵盖 了 所 有 值 为 1 的 点 ， 所 以 
它们 的 和 五 + pg 就 是 与 p 一 gq 等 价 的 表达 式 ， 也 就 是 说 (P 一 9)= (P+p9g)。 





图 12-12 表示 p 一 9g 的 卡 诺 图 中 的 两 个 蕴涵 项 5 和 pg 


与 卡 诺 图 中 的 列 涵 项 对 应 的 矩形 必须 具有 特殊 的 “外 观 ”。 对 源 自 双 变 量 函 数 的 简单 卡 诺 图 
来 说 ， 这 些 和 矩形 只 可 能 是 下 列 之 一 。 

(1) 单个 点 ; 

(2) 某 行 或 某 列 ; 

(3) 整个 图 。 

卡 诺 图 中 的 单个 点 对 应 着 最 小 项 ， 通 过 为 该 点 所 在 行 和 列 相应 变量 对 应 的 文字 求 积 ， 便 可 
以 得 出 其 表达 式 。 也 就 是 说 ,如果 该 点 所 在 的 行 或 列 是 0, 就 可 以 分 别 为 该 行 或 该 列 对 应 的 变量 
取 反 。 如 果 该 点 在 对 应 1 的 行 或 列 中 ,就 取 对 应 的 变量 本 身 。 例 如 ， 图 12-12 中 较 小 的 蕴涵 项 就 
在 p=1 的 那 行 和 g=1 的 那 列 中 。 这 就 是 我 们 要 用 非 否 定 文 字 p 和 gq 的 积 作为 该 蕴涵 项 的 原因 。 

双 变 量 卡 诺 图 中 行 或 列 对 应 着 两 个 对 一 个 变量 相同 而 对 男 一 个 变量 相反 的 点 。 与 之 对 应 文 
字 的 “ 积 ” 就 减少 为 单个 文字 。 剩 下 的 这 个 文字 具有 共同 值 为 这 些 点 所 共享 的 变量 。 如 果 该 共 
同 值 是 90， 那么 该 文字 就 是 否定 的 ， 而 如 果 共 享 的 值 是 1， 该 文字 就 是 非 否 定 的 。 因 此 ， 图 12-12 
中 较 大 的 蕴涵 项 ， 即 第 一 行 ， 其 中 的 点 具有 相同 的 p 值 。 该 值 是 9， 这样 就 说 明 为 该 蕴涵 项 使 用 
文字 积 五 是 合理 的 。 

由 整个 图 组 成 的 萤 涵 项 是 种 特例 。 原 则 上 讲 ， 这 对 应 着 积 退 化 为 常数 1， 或 者 说 TRUE 的 情 
况 。 显 然 ， 对 应 逻辑 表达 式 TRUE 的 卡 诺 图 在 图 中 所 有 点 的 位 置 都 是 1。 


12.6.4” 质 强 涵 项 


如 有 果 布 尔 函 数 的 缠 涵 项 x 在 删除 其 中 任何 文字 后 不 再 为 总 涵 项 , 则 x 就 是 /的 质 蕴 涵 项 (prime 
implicant )。 事 实 上 ， 质 列 涵 项 就 是 所 仿 文 字 尽 可 能 少 的 蕴涵 项 。 

请 注意 ， 这 样 的 矩形 越 多 ， 其 积 中 文字 的 数量 就 越 少 。 我 们 一 般 会 选择 用 文字 较 少 的 积 蔡 
换 具 有 很 多 文字 的 积 ,文字 较 少 的 积 涉及 的 运算 符 更 少 ,， 因 此 “更 加 简单 ”。 所 以 我 们 在 选择 各 
十 蕴涵 项 涵盖 卡 诸 图 时 最 好 只 考虑 那些 质 缠 涵 项 。 
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请 记 住 , 对 应 某 给 定 卡 庄 图 的 每 个 强 涵 项 都 只 由 值 为 1 的 点 组 成 ,一 个 缠 泣 项 之 所 以 是 质 总 
涵 项 ， 是 因为 使 其 大 小 翻番 可 能 会 迫使 我 们 融入 一 个 值 为 0 的 点 。 

















+ 示例 12.13 

在 图 12-12 中 , 较 大 的 蕴涵 项 7 是 质 蕴涵 项 ， 因 为 唯一 可 能 比 它 还 大 的 缠 涵 项 是 全 图 ， 而 后 
者 不 可 能 是 列 涵 项 ， 因 为 全 图 中 含有 0。 较 小 的 萤 涵 项 pg 不 是 质 草 涵 项 ， 因 为 它 被 包含 在 只 由 1 
组 成 、 同 为 该 “ 草 涵 ” 卡 诺 图 列 涵 项 的 第 二 列 中 。 图 12-13 展 示 出 了 该 “ 草 涵 ”图 仅 有 的 质 蕴 涵 
项 。 “它们 对 应 着 积 五 和 4， 而 且 它们 可 以 进一步 组 成 表达 式 五 +4 , 我们 在 12.3 节 中 就 注意 到 这 
一 表达 式 是 与 p 一 9 等 价 的 。 

















图 12-13 ”对 应 “蕴涵 ”也 数 的 质 缠 涵 项 和 gq 


12.6.5 ”三 变量 卡 诺 图 


当真 值 表 中 有 3 个 变量 时 ， 我 们 可 以 使 用 图 12-14 这 样 两 行 四 列 的 图 ， 该 图 对 应 图 12-8 所 示 
的 进位 输出 真 值 表 。 请 注意 ， 与 两 个 变量 ( 本 例 中 是 变量 y 和 c ) 的 值 对 对 应 的 各 列 是 按照 一 种 
特别 的 次 序 排 列 的 。 原 因 在 于 ， 我 们 希望 邻接 的 列 对 应 的 真 值 赋值 只 有 一 个 变量 是 不 同 的 。 假 
如 按照 一 般 的 顺序 00、01、10、11 来 排列 ， 中 间 的 两 列 就 会 有 y 和 c 两 个 变量 是 不 同 的 。 还 要 注 
意 ， 第 一 列 和 最 后 一 列 也 是 “邻接 的 "， 这 样 它们 只 有 变量 y 是 不 同 的 。 因 此 ， 当 我 们 选择 蕴涵 
项 时 ， 可 以 把 第 一 列 和 最 后 一 列 看 作 2x2 的 矩阵 ， 而 且 可 以 把 每 行 的 第 一 个 点 和 最 后 一 个 点 当 
作 1x2 的 和 矩阵 。 























YC 





图 12-14 ”对 应 进位 输出 函数 的 卡 诺 图 ， 其 中 质 更 涵 项 是 xc、y7c 和 季 





J 一 般 来 讲 ， 可 能 有 多 个 可 以 涵盖 某 给 定 卡 诺 图 的 质 蕴 涵 项 集合 。 
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我 们 需要 推导 该 三 变量 卡 诺 图 有 哪些 矩形 表示 可 能 的 列 池 项。 首先， 许可 的 矩形 必须 对 应 
文字 的 积 。 在 任何 积 中 , 各 变量 只 可 能 以 如 下 3 种 方式 之 一 出 现 : 否定 的 、 非 否定 的 ， 或 根本 没 
有 。 当 变量 是 否定 的 或 非 否定 的 时 ， 它 会 让 对 应 列 涵 项 的 点 数 减 半 ， 因 为 只 有 具有 该 变量 合适 
的 值 的 点 才 属 于 该 蕴 池 项 。 因 此 ,蕴涵 项 中 的 点 数 总 是 2 的 乘 方 。 因 此 ,对 各 变量 而 言 ， 许 可 的 
列 涵 项 是 满足 以 下 条 件 之 一 的 有 干 个 点 。 

(1) 只 包含 该 变量 等 于 0 的 点 ; 

(2) 只 包含 该 变量 等 于 1 的 点 ; 

(3) 该 变量 是 什么 值 都 没有 区 别 。 
































从 卡 诺 图 中 解读 蕴涵 项 


不 管 涉及 多 少 个 变量 , 都 可 以 取 任 一 表示 蕴涵 项 的 托 形 , 并 生成 只 对 该 矩形 中 的 点 来 说 为 
TRUE 的 文字 积 。 如 果 1 是 任意 变量 ， 那 么 

(1) 如 果 该 矩形 中 的 每 个 点 都 有 p=1 ， 那 么 p 是 该 积 中 的 文字 。 

(2) 如 果 该 矩形 中 的 每 个 点 都 有 p=0， 那 么 万 是 该 积 中 的 文字 。 

(3) 如 果 该 矩形 中 某 些 点 有 p=0， 而 另 一 些 点 有 =1 ， 那 么 该 积 中 没有 变量 p 的 文字 。 








对 三 变量 卡 详 图 而 言 ， 可 以 按照 以 下 方式 列举 可 能 的 昔 涵 项 。 

(1) 任何 点 。 

(2) 任何 列 。 

(3) 任何 一 对 水 平 邻接 的 点 ， 包 含 末 端 环 回 的 情况 ， 也 就 是 各 行 的 第 1 列 和 第 4 列 构成 的 
Ns, 

(4) 任何 行 。 

(5) 任何 由 两 列 邻接 列 组 成 的 2x2 正方 形 ， 包 括 末 端 环 回 的 情况 ， 也 就 是 第 1 和 第 4 列 。 

(06) 整个 图 。 


+ 示例 12.14 

对 应 进位 输出 函数 的 3 个 质 列 涵 项 如 图 12-14 所 示 。 我 们 可 以 将 各 质 列 涵 项 转换 成 文字 之 积 ， 
详细 方法 见 上 文 附注 栏 内 容 “ 从 卡 诺 图 中 解读 蕴涵 项 ”。 对 应 的 积 是 最 左边 的 xc， 垂直 的 yc 和 最 
右边 的 xy。 这 3 个 表达 式 的 和 就 是 我 们 在 示例 12.7 中 用 非 正式 方法 得 出 的 析 取 范式 ， 你 现在 应 该 
就 明白 这 一 表达 式 是 怎么 得 出 的 了 。 


+ 示例 12.15 
图 12-15 展 示 了 与 三 变量 布尔 函数 NANDW, 9, 门 对 应 的 卡 诺 图 。 质 列 涵 项 有 
(1) 第 一 行 ， 对 应 万 ; 
(2) 前 两 行 ， 对 应 了 ; 
(3) 第 1 和 第 4 列 ， 对 应 地 。 
此 该 卡 诺 图 的 析 取 范式 是 +9+ 产 。 
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图 12-15 ”NAND(p, 9, 7) 的 卡 诺 图 ， 其 中 质 缠 涵 了 
12.6.6 ”四 变量 卡 诺 图 


四 参数 函数 可 以 用 4x4 的 卡 诺 图 表示 ， 该 图 中 两 个 变量 对 应 各 行 ， 男 两 个 变量 对 应 各 列 。 
对 图 中 的 行 和 列 ， 我 们 必须 用 到 之 前 为 三 变量 卡 诺 图 的 列 排序 时 所 用 到 的 次 序 ， 得 到 的 四 变量 


卡 诺 图 就 如 图 12-16 所 示 。 对 四 变量 卡 讳 图 来 说 , 行 和 列 的 邻接 部 要 考虑 到 末端 环 回 的 情况 。 也 
就 是 说 ,顶部 的 行 和 底部 的 行 是 邻接 的 , 最 左 的 列 和 最 右 的 列 是 邻接 的 。 作 为 一 个 重要 的 特例 ， 
4 个 角 上 的 点 也 形成 了 一 个 2x2 的 和 矩形， 它们 对 应 着 图 12-16 中 的 文字 之 积 55 (这 不 是 图 12-16 
中 的 蕴涵 项 ， 因 为 右 下 角 是 0 )。 
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pd 





图 12-16 标示 了 质 蕴 涵 项 ， 对 应 “至 多 一 个 1” 函 数 的 卡 诺 图 
四 变量 卡 诺 图 中 对 应 文字 积 的 矩形 分 别 为 : 
(1) 任何 点 ; 
(2) 任何 两 个 水 平 或 垂直 方向 上 的 邻接 点 ， 包 含 那些 未 端 环 回 情 况 下 的 邻接 点 ; 
(3) 任何 行 或 列 ; 


(4) 任何 2x2 正 方形 ， 包 括 那 些 末 端 环 回 的 情况 ， 比 如 顶部 的 那 行 中 的 两 个 点 ， 以 及 同 两 
列 中 底部 那 行 的 两 个 点 。 正 如 之 前 提 过 的 ， 图 中 4 个 角 上 点 也 是 这 种 “正方 形 ” 的 一 个 特例 
(5) 任何 2x4 或 4x2 的 矩形 ,包括 那些 末端 环 回 的 情况 ， 比 如 第 一 列 加 上 最 后 一 列 ; 
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(6) 整个 图 。 


+ 示例 12.16 

图 12-16 展 示 了 具有 p、g、r、s4 个 变量 布尔 函数 对 应 的 卡 诺 图 ， 该 函数 在 输入 中 至 多 有 一 
个 1 时 值 才 是 1。 其 中 有 4 个 质 缠 涵 项 ， 都 是 大 小 为 2 的 ， 而 且 其 中 有 两 个 是 末端 环 回 的 。 顶 部 那 
行 的 第 一 个 点 和 最 后 一 个 点 组 成 的 蕴涵 项 中 ， 两 个 点 的 p、g 和 s 变 量具 有 相同 的 值 ， 而 且 各 变量 








的 共同 值 都 是 9。 因此 它 的 文字 积 就 是 5975 。 而 类 似 地 ， 其 他 强 涵 项 的 积分 别 是 597 、 五 73 和 
4975 。 所 以 对 应 该 函数 的 表达 式 为 
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图 12-17 4 个 角 组 成 的 缠 涵 项 为 质 缠 涵 项 的 卡 诺 图 


+ 示例 12.17 

之 所 以 选择 图 12-17 中 的 卡 诺 图 ， 是 因为 其 中 的 1 所 具有 的 模式 ， 而 不 是 出 于 其 函数 所 具有 
的 显著 特征 。 这 幅 图 展示 一 个 重点 。5 个 质 列 涵 项 一 起 涵盖 了 所 示 的 全 部 值 是 1 的 点 ， 其 中 包括 
由 4 个 角 构 成 的 蕴涵 项 ( 用 虚线 表示 )， 而 该 蕴涵 项 的 文字 积 表 达 式 是 95 ， 另 外 4 个 质 列 涵 项 分 
别 具 有 文字 积 B97 、BPrs 、paqr 和 prs 。 

从 目前 为 止 的 例子 来 看 , 我 们 可 能 会 觉得 , 要 为 该 图 生成 逻辑 表达 式 , 应 该 要 将 全 部 5 个 纺 
涵 项 取 逻 辑 OR。 不 过 ， 片 刻 思 考 后 你 就 会 觉得 ， 最 大 的 草 涵 项 73 是 多 余 的 ， 因 为 所 有 的 点 都 
已 经 被 其 他 4 个 质 列 涵 项 涵盖 了 。 此 外 ， 它 也 是 唯一 一 个 可 以 消除 的 质 列 涵 项 ， 因 为 其 他 4 个 质 
蕴涵 项 都 各 自 含 有 一 个 只 由 自身 涵盖 的 点 。 例 如 ，B97 就 是 唯一 一 个 涵盖 了 第 一 行 第 二 列 那 个 
点 的 质 列 涵 项 。 因 此 下 列表 达 式 就 是 从 图 12-17 所 示 的 卡 诺 图 得 到 的 所 需 的 析 取 范式 。 

Paqr + prs + par 十 PD7 8 








12.6.7 ”习题 


(1) 为 变量 p、g、r 和 s 的 以 下 函数 画 出 卡 诺 图 。 
(a) 如 果 p、g、r 和 s 中 有 一 个 、 两 个 或 三 个 为 TRUE， 则 该 函数 为 TRUE， 如 果 没 有 一 个 为 TRUE 或 
全 部 为 TRUE， 则 该 函数 不 为 TRUE。 
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(b) 如 果 p、q、r 和 和 s 中 至 多 有 两 个 为 TRUE， 则 该 函数 为 TRUE， 如 果 有 三 个 或 四 个 为 TRUE， 则 该 
国 数 不 为 TRUE。 

(c) 如 果 p、9、7r 和 s 中 有 一 个 、 三 个 或 四 个 为 TRUE ， 则 该 函数 为 TRUE ， 如 果 没 有 一 个 为 TRUE 或 
有 两 个 为 TRUE， 则 该 函数 不 为 TRUE。 

(d) 由 逻辑 表达 式 pqr 一 8 表示 的 函数 。 

(e) 如 果 pgrs 所 表示 的 二 进 制 数 字 的 值 小 于 10， 则 该 函数 为 TRUE。 

(2) 为 习题 (1) 中 的 各 个 卡 庄 图 找 出 除了 最 小 项 之 外 的 蕴涵 项 。 它 们 中 有 哪些 是 质 缠 涵 项 ?为 各 函数 找 
出 涵盖 卡 诺 图 中 所 有 1 的 质 更 涵 项 之 和 。 是 否 要 用 到 所 有 的 质 药 涵 项 ? 

(3) 证 明 ， 布 尔 函 数 析 取 范式 中 的 每 个 积 都 是 该 函数 的 缠 涵 项 。 

(4) * 大 家 还 可 以 根据 卡 庄 图 构造 合 取 冰 式 。 首 先 要 找到 形成 玛 涵 项 的 那 种 矩形 ， 不 过 这 里 矩形 中 的 
点 要 全 部 为 0， 而 不 是 全 部 为 1。 这 样 的 矩形 可 以 称 为 “ 反 缠 涵 项 ”。 我 们 可 以 为 各 反 蕴 涵 项 构造 
一 个 对 所 有 除 反 缠 涵 项 所 含 点 之 外 的 点 而 言 值 为 1 的 文字 和 。 对 各 变量 x 而 言 ， 如 果 相 应 的 反 蕴 涵 
项 只 包含 x= 0 的 点 ， 则 该 文字 和 中 具有 文字 x， 而 如 果 相 应 的 反 蕴 涵 项 中 只 有 那些 x =1 的 点 ， 
它 就 具有 文字 。 和 否则 ， 该 文字 和 中 不 含有 涉及 x 的 文字 。 

(5) 利用 习题 (4) 得 到 的 答案 , 为 习题 (1) 中 的 各 函数 写 出 相应 的 合 取 范式 。 要 让 合 取 范式 中 包含 尽 可 能 
少 的 文字 和 。 

(6) ** 在 4x4 的 卡 诺 图 中 ， 有 多 少 构成 草 涵 项 的 (a)1x2 (b)2x2 (c)1x4 (d)2x4 和 矩形 ? 假设 变量 分 
别 是 p、q、r 和 s， 把 它们 的 蕴涵 项 描述 成 文字 积 的 形式 。 


12.7” 重 言 式 


重 言 式 ( tautology ) 是 指 不 管 其 命题 变量 的 值 如 何 ， 其 值 都 为 真 的 逻辑 表达 式 。 对 重 言 式 
而 言 ， 真 值 表 的 所 有 行 ， 或 者 说 卡 诺 图 中 的 所 有 点 ， 都 具有 值 1。 简 单 的 重 言 式 例子 包括 
TRUE 
p+p 
(p+qg)=(p+ P49) 
重 言 式 有 很 多 重要 用 途 。 例 如 ,假设 形 如 EE = 已 这 样 的 表达 式 是 重 言 式 。 那 么 ， 只 要 在 任何 表 
达 式 中 出 现 妃 的 实例 ， 就 可 以 用 已 替换 已 ， 而 得 到 的 表达 式 仍然 表示 相同 的 布尔 函数 。 

图 12-18a 展 示 了 包含 子 表 达 式 5 的 逻辑 表达 式 F 所 对 应 的 表达 式 树 。 而 图 12-18b 则 是 用 忆 ， 
代替 EE 的 相同 表达 式 树 。 原 因 在 于 ， 我 们 知道 两 棵 树 中 标记 为 x 的 节点 ， 也 就 是 对 应 和 万 的 
表达 式 树 的 根 节点 ， 在 两 棵 树 中 一 定 有 着 相同 的 值 ， 因 为 有 =E,。 而 为 两 棵 树 中 nn 以 上 的 部 
分 求 值 ， 显 然 会 得 出 相同 的 值 ， 这 样 就 证 明了 两 棵 树 是 等 价 的 。 这 种 等 价 表 达 式 可 以 彼此 替换 
的 能 力 通俗 点 讲 就 是 “以 相等 换 相 等 "。 请 注意 , 在 其 他 的 代数 ,诸如 算术 、 集 合 、 关 系 或 正则 
表达 式 代 数 中 ， 也 可 以 把 一 个 表达 式 替 换 为 另 一 个 具有 相同 值 的 表达 式 。 


。 。 
AR pe 
2 做 


(a) 含 妃 的 表达 式 (b) 含 巨 的 表达 式 
图 12-18 ”展示 以 相等 换 相 等 的 表达 式 树 
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+ 示例 12.18 
考虑 逻辑 运算 符 OR 的 结合 律 ， 可 以 将 其 表示 为 表达 式 
((p+q)+r)=(p+(g+7)) (12.7) 
图 12-19 展 示 了 对 应 各 子 表达 式 的 真 值 表 。 而 标号 为 E 的 最 后 一 列 就 表示 整个 表达 式 。 不 难 
看 出 ,对 应 的 每 一 行 都 具有 值 1， 这 说 明 表 达 式 (12.7) 是 重 言 式 。 这 样 一 来 ， 只 要 我 们 看 到 形 如 
(p+9)+r 的 表达 式 , 就 可 以 直接 将 其 蔡 换 为 p+ (q+r)。 请 注意 , p、q 和 r 可 以 代表 任何 表达 式 ， 
只 要 两 边 的 5p、q 和 x 各 日 使 用 了 相同 的 表达 式 ， 可 以 保持 一 致 即 可 。 
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图 12-19 证 明 oR 的 结合 律 的 真 值 表 


12.7.1 替换 原则 


正如 我 们 在 示例 12.18 中 指出 的 ， 当 给 出 涉及 某 些 特定 命题 变量 的 法 则 时 ， 该 法 则 不 仅 适用 
于 字面 上 的 那些 变量 ， 而 且 可 以 用 任何 表达 式 来 蕉 换 各 变量 。 根 本 原因 在 于 ， 在 我 们 对 重 言 式 
的 一 个 或 多 个 变量 进行 替换 后 ， 重 言 式 还 是 重 言 式 。 这 一 事实 称 为 替换 原则 ( substitution 
principle )。 ?当然 ， 我 们 必须 用 同样 的 表达 式 蔡 换 多 次 出 现 的 同一 个 变量 。 


+ 示例 12.19 

逻辑 运算 符 AND 的 交换 律 可 以 通过 证 明 逻 辑 表 达 式 pq = gp 是 重 言 式 得 到 验证 。 要 得 到 这 一 法 

则 的 一 些 实例 ， 可 以 对 该 表达 式 进 行 奉 换 。 例 如 ， 可 以 用 r+s 替换 p， 并 用 地 替换 Y， 得 到 等 价 式 
(r+s)(7)=(7)(r+s) 

请 注意 ， 这 里 为 每 个 被 替换 的 表达 式 都 加 上 了 插 号 ， 以 防 因为 运算 符 优先 级 约定 而 意外 改变 运 

算 符 的 分 组 。 在 该 情况 中 ，r+ts 两 边 的 括号 是 必要 的 ,但 5 两边 的 括号 则 可 以 省 略 掉 。 

还 有 其 他 的 替换 实例 如 下 。 可 以 用 rx 蔡 换 p， 而 且 不 蔡 换 g， 这 样 就 得 到 xq=gqr 。 可 以 只 留 
下 p， 把 gq 替换 为 常量 表达 式 1 (TRUE )， 从 而 得 到 p AND 1=1 AND p。 不 过 ,我们 用 x 代替 式 子 中 
出 现 的 第 一 个 p， 并 用 另 一 个 不 同 的 表达 式 r+s 蔡 换 第 二 个 p。 也 就 是 说 ，7rg = g(r+s) 不 是 重 言 
式 (如 果 s=g=1 且 r=0, 它 的 值 就 是 0 )。 

如 果 考 虑 表达 式 树 ， 就 可 以 看 到 替换 原则 一 直 成 立 的 原因 了 。 想 象 一 下 对 应 某 个 重 言 式 的 
表达 式 树 ， 比 如 图 12-20 所 示 的 对 应 示例 12.19 中 重 言 式 的 表达 式 树 。 因 为 该 表达 式 是 重 言 式 , 所 
以 我 们 知道 ， 不 管 为 处 于 叶子 节点 处 的 命题 变量 指定 什么 真 值 ， 根 节点 的 值 都 为 真 ( 只 要 我 们 
为 标号 为 某 给 定 变量 的 各 个 叶子 节点 指定 相同 的 真 值 )。 






































QD 不 应 该 把 替换 原则 与 “以 相等 换 相 等 ”和 弄 混 。 替 换 原则 只 适用 于 重 言 式 ， 而 在 任何 表达 式 中 都 能 够 以 相等 换 相等 。 
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p d d p 
图 12-20 ”对 应 重 言 式 pg = dp 的 表达 式 树 


现在 假设 用 具有 表达 式 树 忆 的 表达 式 蔡 换 p, 并 用 具有 表达 式 树 7 的 表达 式 蔡 换 9, 一 般 来 
说 ， 我 们 会 为 重 言 式 的 每 个 变量 选择 一 棵 树 ， 并 用 为 该 变量 选择 的 树 蔡 换 对 应 该 变量 的 所 有 叶 
子 节点 。 这样 就 得 到 了 一 棵 类 似 图 12-21 所 示 的 新 表达 式 树 。 当 为 新 树 的 变量 指定 真 值 时 ， 作 
为 树 T, 根 节点 的 各 个 节点 都 有 相同 的 值 ， 因 为 任何 这 样 的 节点 背后 都 执行 了 相同 的 求 值 步骤 。 


AND AND 
> 0 > 
了 Jo Jo 77 
图 12-21 对 图 12-20 中 变量 的 替换 


一 旦 图 12-21 中 7, 和 这 样 的 树 的 根 节点 完成 求 值 ， 就 得 到 与 图 12-20 所 示 的 原 有 的 树 根 方 
点 处 变量 相同 的 值 。 也 就 是 说 ,不 管 我 们 为 出 现 的 那些 7, 算 出 什么 样 的 值 ， 它 们 一 定 是 全 部 相 
同 的 ， 我 们 要 取 这 个 值 ， 并 将 其 指定 给 原 有 的 树 中 标号 为 p 的 叶子 节点 。 我 们 还 要 为 9 进行 相同 
的 处 理 ， 而 且 一 般 来 说 ， 要 为 出 现在 原 有 的 树 中 的 任何 节点 进行 这 一 处 理 。 因 为 原 有 的 树 表示 
重 言 式 ， 所 以 可 知 为 该 树 求 值 会 在 根 节点 得 到 值 TRUE， 而 且 新 构造 的 树 也 能 在 根 节点 处 生成 值 
TRUE。 因 为 不 管 为 新 树 中 的 变量 进行 怎样 的 值 蔡 换 ， 以 上 推理 都 能 保持 成 立 ， 所 以 可 以 得 出 结 
论 : 由 新 树 表示 的 表达 式 也 是 重 言 式 。 
12.7.2 ” 重 言 式 问 题 

重 言 式 问题 就 是 测试 某 给 定 逻 辑 表达 式 是 否 等 价 于 TRUE， 也 就 是 说 ， 测 试 该 表达 式 是 否 为 
重 言 式 。 有 一 种 简单 方式 可 以 解决 该 问题 。 为 该 表达 式 构建 真 值 表 ， 其 中 每 一 行 对 应 表达 式 中 
各 变量 的 一 种 真 值 赋值 。 然 后 为 该 表达 式 的 表达 式 树 中 各 个 内 部 节点 创建 一 列 ， 并 按照 合适 的 
从 下 到 上 的 次 序 ， 针 对 变量 的 各 种 真 值 赋值 为 各 个 节点 求 值 。 当 且 仅 当 对 每 种 真 值 赋值 而 言 整 
个 表达 式 的 值 都 是 1 (TRUE ) 时 ,该 表达 式 是 重 言 式 。 示 例 12.18 就 展示 了 这 一 过 程 。 


12.7.3 重 言 式 测试 的 运行 时 间 


如 果 表 达 式 有 k 个 变量 和 n 个 运算 符 ， 那 么 这 种 真 值 表 就 有 2 行 和 z 列 需要 填写 。 因 此 我 们 
可 以 预期 这 种 算法 的 简单 实现 要 花 O(2”n) 的 时 间 。 这 一 时 间 对 只 有 两 三 个 变量 的 表达 式 来 说 并 
不 长 ， 即 便 是 对 20 个 变量 来 说 ， 用 计算 机 也 只 需要 几 分 钟 就 能 完成 测试 。 不 过 ， 对 30 个 变量 而 















































J 作为 特例 ， 为 某 个 变量 x 选择 的 树 可 能 是 标号 为 x 的 单个 节点 ， 就 和 没有 对 x 进行 替换 一 样 。 
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言 ， 有 10 亿 行 ， 就 算是 使 用 计算 机 ， 也 几乎 没 法 完成 这 一 测试 。 这 一 结果 是 用 到 指数 时 间 算 法 
的 典型 下 场 。 对 较 小 的 实例 来 说 ， 一 般 看 不 出 什么 问题 。 但 随 着 问题 实例 变 大 ， 突 然 间 我 们 会 
发 现 ， 即 使 有 着 速度 最 快 的 计算 机 ， 也 不 可 能 在 可 以 接受 的 时 间 内 解决 这 个 问题 。 


C*) 


图 12-22 P 是 可 在 多 项 式 时 间 内 解决 的 问题 族 ，NP 是 可 在 非 确 定 多 项 式 时 
间 内 解决 的 问题 族 ，NPC 则 是 NP 完全 问题 族 








NP 





固有 的 难 解 问题 


重 言 式 问题 “是 否 为 重 言 式 ” 看 似 天 生 是 指数 时 间 的 问题 。 也 就 是 说 ， 如 果 表 达 式 中 
有 k 个 交 量 ， 所 有 已 知 解决 重 言 式 问 题 的 算法 的 运行 时 间 都 是 的 指数 函数 。 

存在 这 样 一 类 称 为 NP 完全 问题 的 问题 ， 其 中 包含 了 很 多 重要 的 优化 问题 ， 而 没 人 知道 如 
何在 少 于 指数 时 间 的 时 间 内 解决 这 些 问 题 。 很 多 数学 家 与 科学 家 经 过 长 时 间 的 艰难 尝试 , 试 着 
为 这 些 问题 中 至 少 一 个 问题 找到 运行 时 间 少 于 指数 时 间 的 算法 ， 不 过 这 样 的 算法 还 没 被 找到 
过 ， 而 很 多 人 现在 怀疑 根本 不 存在 这 样 的 算法 。 

可 满足 性 问题 ( satisfiability problem ) 就 是 一 个 经 典 的 NP 完全 问题 ， 这 个 问题 是 说 “是 否 
存在 一 种 真 值 赋值 让 逻辑 表达 式 为 真 ? ”可 满足 性 问题 与 重 言 式 问题 有 着 密切 的 关系 ， 而 且 就 
像 重 言 式 问 题 一 样 ， 对 可 满足 性 问题 来 说 ,也 没有 比 循环 经 历 所 有 可 能 的 真 值 赋值 好 更 多 的 解 
决 方案 了 。 

要 么 所 有 的 NP 完 全 问题 都 具有 少 于 指数 时 间 的 解决 方案 ， 要 么 所 有 的 NP 完 全 问题 都 没有 
这 样 的 解决 方案 。 因 此 各 NP 完全 问题 看 似 需 要 指数 时 间 这 一 事实 让 我 们 更 加 相信 这 些 问题 天 
生 是 指数 时 间 的 问题 。 有 很 强 的 迹象 表明 这 种 简单 的 可 满足 性 测试 就 是 最 好 的 做 法 了 。 

顺便 提 一 句 ，NP 代 表 “ 非 确定 多 项 式 ”( Nondeterministic Polynomial )。 粗 略 地 讲 ,，“ 非 确 
定 ” 就 意味 着 “猜测 正确 的 能 力 ”"， 正 如 10.3 节 中 讨论 过 的 。 如 果 为 针对 某 个 大 小 为 n 的 实例 的 
解决 方案 给 出 一 次 猜测 ， 我 们 可 以 在 多 项 式 时 间 ( 也 就 是 对 菜 常 数 c 而 言 的 时 间 n ) 内 验证 该 
猜测 是 正确 的 ， 就 说 该 问题 能 在 “ 非 确定 多 项 式 时 间 内 解决 ”。 

可 满足 性 是 这 种 问题 的 一 个 例子 。 如 果 为 变量 给 出 一 组 声明 (或 者 说 猜测 ) 为 可 以 使 表达 
式 E 得 到 值 1 的 真 值 赋值 ， 我 们 可 以 将 赋值 代入 操作 数 为 E 求 值 ， 并 在 至 多 为 E 的 长 度 的 二 次 方 
的 时 间 内 验证 该 表达 式 是 否 得 到 满足 。 

像 可 满足 性 问题 这 样 可 以 通过 猜测 加 上 多 项 式 时 间 的 验证 来 “解决 ”的 这 类 问题 称 为 NP 
问题 。 有 一 些 NP 问 题 其 实 是 相当 简单 的 ， 不 经 过 猜测 就 可 以 解决 ， 而且 只 需要 花 输 入 长 度 的 
多 项 式 的 时 间 。 不 过 ， 有 很 多 NP 问题 被 证 实 非 常 难 , 而 这 些 问题 就 是 NP 完全 问题 。( 不 要 把 这 
里 表示 “这 类 问题 中 最 难 ” 的 “完全 ”， 与 之 前 表达 式 “ 能 表示 每 个 布尔 函数 ”的 “运算 符 完 
全 集 ” 中 的 “完全 ” 弄 混 了 。) 
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在 多 项 式 时 间 内 不 通过 猜测 就 可 以 解决 的 问题 族 通常 称 为 P。 图 12-22 展 示 了 P、NP 和 NP 
完全 问题 之 间 的 关系 。 如 果 任 何 NP 完 全 问题 在 P 中 ， 那 么 了 = NP ， 我 们 会 非常 怀疑 这 种 情况 ， 
因为 所 有 已 知 的 NP 完全 问题 以 及 一 些 其 他 的 NP 问题 , 都 不 会 出 现在 P 中 。 没 人 相信 重 言 式 问题 
会 在 NP 中 ,不 过 它 的 难度 不 低 于 NP 中 的 任何 问题 (被 称 为 NP 难题 )， 而 且 如 果 重 言 式 问题 在 P 
中 ， 那 么 有 P= NMP 。 





12.7.4 习题 


(1) 以 下 表达 式 中 哪些 是 重 言 式 ? 
(a) pgr p+g 
人) (p09) Pn 
(c) (p49 Pp 
(d) (p=(g+7)) (oP7) 
(2)* 假设 有 一 种 为 逻辑 表达 式 解 决 重 言 式 问题 的 算法 ， 说 明 如 何 用 这 种 算法 实现 下 列 目 的 。 
(a) 确定 两 个 表达 式 是 否 等 价 。 
(b) 解决 有 关 可 满足 性 的 问题 ( 见 上 文 附注 栏 “ 固 有 的 难 解 问题 ” ) 。 


12.8 ”逻辑 表达 式 的 一 些 代数 法 则 


在 本 节 中 ， 我 们 将 列举 一 些 实用 的 重 言 式 。 在 各 种 情况 中 ， 我 们 都 只 陈述 法 则 ， 而 将 重 言 
式 的 验证 工作 留 给 读者 通过 构造 真 值 表 来 完成 。 


12.8.1 等 价 的 法 则 


首先 要 从 一 些 与 等 价 如 何 起 效 有 关 的 结论 开始 。 大 家 应 该 注意 到 等 价 性 在 这 里 的 双重 身份 。 
它 是 我 们 在 逻辑 表达 式 中 使 用 的 众多 运算 符 之 一 。 不 过 ， 它 也 是 表示 两 个 表达 式 “相等 ”并 能 
互相 替换 的 符号 。 因 此 形 如 互 =, 这样 的 重 言 式 表明 了 一 些 与 5 和 ,有关 的 信息 , 即 利 用 “ 相 
等 可 以 由 相等 替换 ”的 原则 ， 它 们 在 更 大 的 表达 式 中 是 可 以 相互 奉 换 的 。 

此 外 ,我 们 可 以 利用 等 价 证 明 其 他 的 等 价 。 如 果 有 一 列表 达 式 瑟 、E,、…、E, ， 满 足 每 个 表 
达 式 都 能 通过 相等 换 相 等 的 替换 从 前 一 个 表达 式 得 到 ， 那 么 在 用 相同 的 真 值 赋值 为 这 些 表达 式 
求 值 时 ， 它 们 会 得 到 相同 的 值 。 这 样 一 来 ，E = 五 一 定 是 重 言 式 。 

12.1 等 价 的 自 反 性 : p=p。 

正如 我 们 要 陈述 的 所 有 法 则 一 样 ， 替换 原则 是 适用 的 , 这 样 可 以 用 任意 表达 式 代 替 p。 因 此 
该 法 则 表明 任何 表达 式 都 是 与 自身 等 价 的 。 

12.2 等 价 的 交换 律 : (p=g)=(g=p)。 

非 正式 地 讲 ， 当 且 仅 当 4 等 价 于 p 时 有 P 等 价 于 9g。 根 据 蔡 换 原则 ,如 果 任 一 表达 式 互 与 另 一 
表达 式 ,等 价 ， 那 么 ,就 等 价 于 互 。 因 此 已 和 已 是 可 以 互相 替换 的 。 

12.3 等 价 的 传递 性 : ((p=g)AND(qg=7)) 一 (p=7)。 

非 正 式 地 讲 ， 如 果 p 等 价 于 q， 而 且 q 等 价 于 r， 那 么 p 就 等 价 于 r。 这 条 法 则 具有 一 个 重要 的 
推论 ， 如 果 我 们 得 出 = ,和 ,= ,是 重 言 式 ， 那 么 = 也 是 重 言 式 。 
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12.4 否定 的 等 价 : (p=q)= (p=9)。 

当 且 仅 当 两 个 表达 式 的 否定 等 价 时 ， 这 两 个 表达 式 是 等 价 的 。 
12.8.2 ”类 似 算 术 的 法 则 

在 算术 运算 符 +、x 和 一 元 减 号 与 逻辑 运算 符 OR、AND 和 NOT 之 间 存 在 一 种 类 比 。 因 此 以 下 
法 则 应 该 不 会 让 大 家 感到 意外 。 

12.5 AND 运 算 的 交换 律 : pg=gqp。 

非 正 式 地 讲 就 是 ， 只 有 在 qp 为 真 时 ，pq 才 为 真 。 

12.6 AND 运 算 的 结合 律 : p(gr)= (pq)r。 

非 正式 地 讲 ， 要 为 3 个 变量 (或 表达 式 ) 的 AND 分 组 ， 既 可 以 先 取 前 两 个 变量 ( 或 表达 式 ) 
的 AND， 也 可 以 先 取 后 两 个 变量 ( 或 表达 式 ) 的 AND。 此 外 ， 加 上 法 则 12.5， 我 们 可 以 证 明 任 意 
一 系列 命题 或 表达 式 的 AND 都 可 以 按照 我 们 的 意愿 随意 排列 和 分 组 一 一 结果 都 是 相同 的 。 

12.7 OR 运 算 的 交换 律 : (p+gq)=(g+p)。 

12.8 OR 运 算 的 结合 律 : (p+(q+7))=((p+q)+r)。 

这 一 法 则 和 法 则 12.7 表 明了 任何 表达 式 集 的 OR 都 可 以 随意 分 组 。 

12.9 AND 对 OR 的 分 配 律 : Pp(g+ 门 =(pg+Pr) 。 

也 就 是 说 ， 如 果 我 们 希望 为 pP 和 两 个 命题 或 表达 式 的 OR 取 AND， 既 可 以 先 取 OR， 也 可 以 对 p 
与 各 表达 式 先 取 AND， 得 到 的 结果 是 相同 的 。 

12.10 1 (TRUE ) 是 AND 的 单位 元 : p AND 0=p。 

请 注意 ，(1 ANDp)=p 也 是 重 言 式 。 我 们 不 需要 说 出 它 ， 因 为 它 可 由 替换 原则 和 之 前 的 法 则 
得 出 。 也 就 是 说 ， 可 以 在 12.5( AND 的 结合 律 ) 中 用 1 替换 p 并 用 p 蔡 换 qg， 从 而 得 到 重 言 式 (1 AND 
Pp)= (p AND 1)。 然 后 ， 应 用 12.3( 等 价 的 传递 性 )， 就 得 到 (1 ANDp)=p。 

12.11 0 (FALSE ) 是 OR 的 单位 元 : (p OR 1)=p。 

同样 地 ， 可 以 利用 与 12.10 如 出 一 辐 的 论证 ,得 出 (0 OR p)=p。 

12.12 0 是 AND 的 零 元 : (p AND 0)=0。" 

回想 一 下 10.7 节 ， 运 算 符 的 零 元 是 指 这 样 一 个 篆 数 ， 我 们 对 该 常数 和 任意 值 应 用 该 运算 符 
所 得 到 的 值 都 是 该 零 元 。 请 注意 ， 在 算术 运算 中 ，0 是 x 的 零 元 ， 但 + 是 没有 零 元 的 。 不 过 ,我 
们 会 看 到 1 是 oOR 的 零 元 。 

12.13 双重 否定 的 抵消 : (NOT NOTp)=p。 














算术 和 逻辑 运算 符 类 比 的 利用 
我 们 使 用 对 应 AND 和 OR 的 简写 符号 时 , 往往 可 以 假装 自己 是 在 处 理 乘法 和 加 法 ,正如 我 们 
在 法 则 12.5 到 12.12 中 所 使 用 的 。 这 是 种 优势 ， 因 为 我 们 对 相应 的 算术 运算 法 则 是 非常 熟悉 的 。 
因此 ， 大 家 应 该 能 很 快 用 pr+ps+gr+gs 或 gq(s+r)+(r+s)p 来 替换 (p+gqg)(r+s)。 
更 难 也 是 更 需要 练习 的 部 分 就 是 应 用 那些 与 算术 运算 不 相似 的 法 则 。 比 如 德 摩根 律 和 OR 
对 AND 的 分 配 律 。 例如， 用 (p+r)(p+s)(qg+r)(g+s) 蔡 换 pgt+rs 是 可 以 的 ,但 要 看 出 这 是 通过 
3 次 应 用 OR 对 AND 的 分 配 律 ， 并 利用 交换 律 和 结合 律 得 到 的 ， 需 要 费 一 些 思量 。 





Q 当然 (0 AND p) 三 0 也 成 立 ， 我们 之 后 不 会 再 提 到 那些 结合 律 的 结果 。 
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12.8.3 ” AND 和 OR 与 加 和 乘 的 区 别 


还 有 很 多 法 则 表现 出 了 AND 和 OR 与 算术 运算 符 x 和 + 的 区 别 ， 这 里 要 列举 一 些 。 

12.14 OR 对 AND 的 分 配 律 : (p+gr)=((p+q)(p+7))。 

就 像 AND 可 以 对 OR 分 配 那 样 ，oR 也 可 以 对 AND 分 配 。 请 注意 ， 相 似 的 算术 形式 ， 
xX+jz 三 (X+y)(X+z) 一 般 而 言 是 不 成 立 的 。 

12.15 1 是 OR 的 零 元 : (1 OR p)=1。 

请 注意 ， 相 似 的 算术 形式 1+x=1 一 般 来 说 是 不 成 立 的 。 

12.16 AND 的 知 等 性 : pp=p。 

回想 一 下 ， 当 运算 符 应 用 到 某 相同 值 的 两 个 副本 时 ， 得 到 的 结果 还 是 该 值 ， 就 说 该 运算 符 
是 帘 等 的 。 

12.17 OR 的 舌 等 性 : p+p=p。 

请 注意 ，x 和 + 都 不 是 霸 等 的 。 也 就 是 说 ， 一 般 来 说 xxx=x 和 x+x=x 都 是 不 成 立 的 。 

12.18 吸收 律 。 

这 一 法 则 有 两 个 版 本 ,取决 于 我 们 想 消 除 的 是 多 余 的 积 还 是 多 余 的 和 。 

(a) (p+pq)=p 

(b) p(p+q)=p 

请 注意 ， 如 有 果 在 (a) 中 用 任意 文字 积 殖 换 p， 并 用 男 一 个 文字 积 蔡 换 g， 就 可 以 说 ， 在 析 取 范 
式 中 ， 可 以 消除 那些 具有 其 他 某 个 积 所 含 文字 之 超 集 的 积 。 较 小 的 集合 就 被 吸收 到 超 集 之 中 。 
在 (b) 部 分 中 , 我 们 对 合 取 范式 作出 同样 的 说 明 , 可 以 消除 那些 是 其 他 某 个 和 中 文字 之 超 集 的 和 。 

12.19 某 些 否 定 的 消除 。 

(a) PLD+9) = pq 

(b) p+p4=p+g 

请 注意 ，(b) 就 是 我 们 在 12.2 节 中 解释 莎 莉 的 条 件 为 何 能 替换 山姆 的 条 件 时 用 到 过 的 法 则 。 


12.8.4 ” 德 摩根 律 


还 有 两 条 法 则 让 我 们 可 以 把 NOT 压 人 AND 和 OR 的 表达 式 中 ， 得 到 一 个 由 各 命题 变量 的 否定 
组 成 的 表达 式 。 得 到 的 表达 式 是 应 用 到 文字 的 AND-OR 表 达 式 。 从 直觉 上 讲 ， 如 果 们 为 具有 AND 
和 OR 的 表达 式 取 反 ， 就 可 以 把 否定 沿 着 表达 式 树 向 下 压 ， 随 着 该 过 程 “翻转 ”运算 符 。 也 就 是 
AND 会 变 成 OR， 反 之 亦 然 。 最 后 ， 和 否定 到 达 叶 子 节点 的 位 置 ， 并 停留 在 那里 ， 除 非 它们 遇 到 知 
定 文字 ， 在 这 种 情况 下 ， 就 要 利用 法 则 12.13 消 除 两 次 否定 。 在 构造 新 表达 式 时 ,一定 要 注意 加 
上 恰当 的 括号 ， 因 为 在 交换 AND 和 OR 时 运算 符 的 优先 级 改变 了 。 

这 些 基 本 规则 就 叫 “ 德 摩根 律 "， 它 们 是 以 下 两 个 重 言 式 。 

12.20 德 摩根 律 

(a) NOT (pg) =p+49 

(b) NOT (p+g) = p49 

(a) 部 分 说 明 ， 只 有 在 p 和 g 之 中 至 少 有 一 个 为 假 时 , p 和 gq 才 都 不 为 真 。 而 (b) 部 分 说 明 ， 当 且 
仅 当 p 和 gq 都 为 假 时 ，p 和 gq 才 都 不 为 真 。 我 们 可 以 将 这 两 条 法 则 一 般 化 ， 使 其 按照 如 下 方式 应 用 


到 任意 数量 的 命题 变量 上 。 
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(c) (NOT(pip2°** pi))= (B+ BP, ++ Di) 
(d) (NOT(P， 十 忆 ++ pi)) =(p.p,… Pi) 
例如 ，(d) 说 明 当 且 仅 当 一 系列 表达 式 全 为 假 时 ， 它 们 才 一 个 都 不 为 真 。 


+ 示例 12.20 
我 们 已 经 在 12.35 和 12.6 节 中 了 解 到 了 如 何 为 任意 逻辑 表达 式 构 造 析 取 范 式 。 假 设 要 从 任意 可 
以 写成 +E,+…+B, ,其 中 各 万 都 是 文字 的 AND 的 表达 式 E 开 始 。 就 可 以 构造 NOT 5 的 合 取 范 
式 。 至 完 有 
NOT(E +E,+:…+ bE) 
然后 应 用 德 摩根 律 (d)， 得 到 
(NOT(E))(NOT(E,)):…(NOT(E,)) (12.8) 





现在 设 是 文字 积 ,XX,,… 了 ,， 其 中 各 XX 要 么 是 变量 ， 要 么 是 变量 的 否定 。 那 么 我 们 可 以 对 
NOT( 5, )， 将 其 变 为 


总 + 总 + 十 部， 
如 果 某 个 文字 X 是 否定 变量 ， 比 方 说 是 7 ， 那 么 利用 法 则 12.13， 消 除 双重 否定 ，X 就 应 该 被 蔡 
换 成 变量 q 本 号。 在 进行 所 有 的 改变 之 后 ， 式 (12.8) 就 变 成 了 文字 和 的 积 。 
例如 ，rs+75 就 是 只 有 在 r=s 时 才 为 真 的 析 取 范式 ,也 就 是 说 , 它 可 以 视 作 利用 AND 、OR 
和 NOT 对 等 价 进行 的 定义 。 以 下 公式 是 上 式 的 否定 ， 只 有 在 r 和 s 不 等 价 ， 也 就 是 r 和 s 刚 好 只 有 一 
个 为 真 时 才 为 真 。 





























NOT(rs+rs ) (12.9) 
现在 对 德 摩根 律 (b) 进 行 蔡 换 ， 用 rs 蔡 换 p， 并 用 75 替换 gq。 那么 (b) 的 左边 就 成 了 式 (12.9)， 而 根 
据 蔡 换 原则 可 知 ， 式 (12.9) 等 价 于 对 (b) 进 行 相同 蔡 换 后 的 右边 ， 也 就 是 
NOT(rs)AND NOT(7S ) (12.10) 
现在 我 们 可 以 应 用 (a)， 其 中 用 x 蔡 换 p 并 用 s 蔡 换 g， 将 NOT (rs) 转 换 成 +5 。 同 样 ，(a) 告 诉 我 们 ， 
NOT(75 ) 与 NOT(7)+NOT(5 ) 是 等 价 的 。 不 过 NoT(7 ) 就 等 同 于 NOT (NOT(r)) ， 也 就 等 价 于 r， 因 为 
双重 否定 是 可 以 抵消 的 。 同 样 NoT(5 ) 也 可 以 被 s 蔡 代 ， 因 此 式 (12.10) 等 价 于 (7+5)(r+s)。 这 是 
表示 “7 和 s 刚 好 只 有 一 个 为 真 ”的 合 取 范 式 。 粗 略 地 说 ， 它 表示 “7 和 s 至 少 有 一 个 为 假 ， 而 且 7 
和 s 至 少 有 一 个 为 真 。” 显然， 这 种 情况 只 有 在 r 和 s 中 刚好 有 一 个 为 真 时 才 会 发 生 。 


12.8.5 “对 偶 性 原理 


在 审视 本 节 所 介绍 的 法 则 时 ， 我 们 会 注意 到 一 个 奇特 的 现象 : 这些 等 价 性 似乎 都 是 成 对 出 
现 的 ， 只 不 过 其 中 的 AND 和 OR 角 色 互 换 了 而 已 。 例 如 , 法 则 12.19 的 (a) 部 分 和 (b) 部 分 就 是 这 样 的 
一 对 ， 而 法 则 12.9 和 12.14 也 是 这 样 的 一 对 ， 后 者 就 是 两 条 分 配 律 。 在 涉及 和 常数 0 和 1 时 ， 它 们 也 
必须 互 换 ， 就 像 在 12.10 和 12.11 这 两 条 有 关 单 位 元 的 法 则 中 那样 。 

在 德 摩根 律 中 可 以 找到 这 一 现象 的 解释 。 假 设 从 重 言 式 = 开始， 其 中 和 ,都 是 涉 
及 运算 符 AND、OR 和 NoT 的 表达 式 。 根 据 法 则 12.4， 有 NoT( EB )=NOT( 万 ,) 也 是 重 言 式 。 现 在 应 用 
德 摩根 律 把 否定 压 过 AND 和 OR。 我 们 要 做 的 ， 就 是 将 每 个 AND“ 反 转 ” 为 OR， 反 之 亦 然 。 而 且 
我 们 会 把 否定 下 移 到 各 操作 数 处 。 如 果 遇 到 NOT 运算 符 ， 就 直接 把 这 个 “移动 的 ”NOT 移 到 该 
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NOT 运 算 符 下 方 ， 直 到 遇 到 另 一 个 AND 或 oOR。 例 外 就 是 当 我 们 遇 到 和 否定 的 文字 ， 比 方 说 万 时 。 
然后 ,我们 把 这 个 移动 的 No 与 已 经 存在 的 那个 结合 起 来 ， 留 下 操作 数 p。 作 为 特例 ， 若 移动 的 
NOT 遇 到 常数 0 或 1， 就 要 为 该 常数 取 否 ， 也 就 是 (NOT 0)=1 和 (NOT 1)=0。 


+ 示例 12.21 

我 们 来 考虑 重 言 式 12.19(b)。 首 先 要 为 两 边 取 否 ， 这 样 就 得 到 了 图 12-23a 所 示 的 树 。 然 后 把 
否定 压 过 等 价 两 边 的 OR, 将 它们 变 成 AND, NOT 符 号 就 出 现在 两 个 OR 的 各 参数 之 上 , 如 图 12-23b 
所 示 。 新 的 NoOT 中 有 3 个 在 变量 之 上 , 所 以 它们 的 移动 就 停止 了 。 而 在 AND 之 上 的 那个 会 将 该 AND 
反 转 成 OR, 并 使 NoT 出 现在 它 的 两 个 参数 之 上 ,这样 右 边 的 参数 就 成 了 NoOT g, 而 左边 的 参数 NOT 
Pp 就 成 了 NOT NoOT p， 也 就 是 p。 得 到 的 树 如 图 12-23c 所 示 。 

图 12-23c 的 树 表 示 表 达 式 (p+9)= 57 。 要 让 该 表达 式 变 成 法 则 12.19(a) 的 形式 ， 就 必须 为 
这 些 变量 取 否 。 也 就 是 说 ， 要 用 五 蔡 换 p， 并 用 了 替换 79。 当 消 除 双重 否定 之 后 ， 剩 下 的 就 刚好 
是 法 则 12.19(a)。 





NOT NOT 
| | 
OR, OR, 
I > 
p AND p q 
0 
NOT q 
| 
E (a) 初始 的 表达 式 树 
2 1 
> > 
NOT NOT NOT NOT 
| | | | 
Dp AND p q 
2 
NOT q 
| 
p 


AND AND 
> 70 
NOT OR NOT NOT 
> 
了 p NOT p gq 

| 
gq 
(c) 最 后 的 表达 式 


图 12-23 ”构造 对 侦 表 达 式 
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12.8.6 ”涉及 强 涵 的 法 则 


这 里 还 有 若干 实用 的 重 言 式 ， 给 出 了 一 运算 符 的 属性 。 

1221 (pq)AND(g 一 D)=(D=9) 。 

也 就 是 说 ， 当 前 仅 当 两 个 表达 式 互相 蕴涵 时 ， 它 们 是 等 价 的 。 

12.22 (P=9g) 一 (PP 一 9)。 

两 个 表达 式 的 等 价 表 明 其 中 一 个 草 涵 另 一 个 。 

12.23 蕴涵 的 传递 性 : ((p 一 qg)AND(g 一 门 ) 人 一 (PP 一 门 。 

也 就 是 说 ， 如 果 p 列 涵 g， 而 且 % 列 涵 r， 那 么 有 p 毕 涵 r。 

12.24 可 以 把 蕴涵 用 AND 和 OR 表 示 出 来 ， 最 简单 的 形式 如 下 。 

(a) (一 9g)=(D+9) 。 

我 们 会 看 到 ， 很 多 情况 下 ， 要 处 理 的 表达 式 会 形 如 “如 果 这 个 而 且 这 个 而 且 …… ， 那 么 那 
个 ”。 例 如 ，Prolog 语 言 和 很 多 “人 工 智 能 ”语言 都 依赖 这 种 形式 的 “规则 ”。 这 些 规则 通常 会 
写成 (pip,…p,) 一 9。 通 过 以 下 等 价 ， 它们 可 以 只 用 AND 和 OR 表示 出 来 。 

(b) (pip,*… pb, 一 9)= (D, + pst 1p, + 9) o 

也 就 是 说 ， 只 要 4 为 真 ， 或 者 这 些 p 中 有 一 个 或 多 个 为 假 ， 该 等 价 的 左边 和 右边 就 都 为 真 ， 
否则 这 两 边 都 为 假 。 


12.8.7 “习题 


(1) 通过 构建 真 值 表 ， 验 证 法 则 12.1 到 12.24 都 是 重 言 式 。 

(2) 可 以 用 表达 式 蔡 换 重 言 式 中 的 任何 命题 变量 ， 并 得 到 另 一 个 重 言 式 。 在 法 则 12.1 到 法 则 12.24 这 些 
重 言 式 中 ， 用 x+y 蔡 换 p，72 蔡 换 y， 并 用 元 蔡 换 上 >， 得 到 新 的 重 言 式 。 如 果 需 要 的 话 ， 不 要 忘 了 给 
新 换 上 的 表达 式 加 上 括号 。 

(3) 证 明 : 

(a) pi+p;+…+p, 与 p,; 任 意 次 序 的 和 (人 敢 辑 OR ) 等 价 。 
(b) pip;p,p; 任 意 次 序 的 积 (逻辑 AND ) 等 价 。 
提示 : 2.4 节 中 为 加 法 展示 过 相似 的 结 
(4) * 利用 本 节 给 定 的 法 则 ， 把 每 一 对 表达 式 中 的 第 一 个 表达 式 变 形 为 第 二 个 。 为 了 减少 工作 量 , 在 
使 用 类 似 算 术 法 则 的 法 则 12.5 到 12.13 时 ， 可 以 省 略 使 用 它们 的 步骤 。 例 如 ，AND 和 oOR 的 交换 律 和 
结合 律 是 可 以 假定 的 。 
(a) 把 pqg+rs 变形 为 (p+r)(p+s)(q+r)(q+s)。 
(b) 把 pg+ par 变形 为 p(q +7)。 
(c) 把 pg+ pg+Pq+ 9 变形 为 1 (该 变形 需要 用 到 12.9 节 介绍 的 法 则 12.25 ) 。 
(d) 把 pg 一 了 变形 为 (4 一 门 +(4 一 门 。 
(e) 把 NOT(pg 一 门 变形 为 pq7 。 
(5) * 利用 之 前 的 法 则 证 明 吸 收 律 12.18(a) 和 12.18(b)， 也 就 是 说 明 只 使 用 法 则 12.1 到 12.17 就 可 以 把 
p+ pg9 变形 为 p， 并 可 以 把 p(p+9) 变形 为 p。 

(6) 应 用 德 摩根 律 ， 将 以 下 表达 式 变 形 为 NoT 只 作用 于 命题 变量 ( 也 就 是 NoT 只 出 现在 文字 中 ) 的 表 

(a) NOT(pqg + pr7) 
(b) NOT (NOT p+g(NOT(r+3))) 
(7)* 利用 基本 法 则 12.20(a) 和 (b)， 通 过 对 k 的 归纳 证 明 一 般 化 的 德 摩根 律 12.20(c) 和 (d)。 然 后 ， 通 过 描 
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述 对 应 各 表达 式 及 其 子 表达 式 的 真 值 表 的 样子 ， 粗略 验 证 这 一 一 般 化 法 则 。 
(8)* 找 出 本 节 中 相互 对 偶 的 法 则 对 。 
(9)* 通过 对 m 的 归纳 证 明 法 则 12.24(b)。 
(10)* 通过 描述 对 应 表达 式 及 其 各 子 表达 式 具 有 2” 行 的 真 值 表 ， 证 明 法 则 12.24(b) 成 立 。 
(11) 使 用 吸收 律 以 及 AND 和 oR 的 交换 律 和 结合 律 ， 简 化 以 下 表达 式 
(a) wx + wxy +ZzXxw 
(12)* 通过 给 出 一 些 特殊 的 数字 使 得 类 比 的 等 式 不 成 立 ， 表 明 法 则 12.14 到 12.20 的 算术 类 比 是 不 成 立 的 。 
(13)* 如 果 从 那些 只 含 AND 、OR 和 NOT 运 算 符 的 逻辑 表达 式 开 始 , 可 以 把 所 有 的 NOT 向 下 压 , 直到 NorT 
全 部 紧邻 命题 之 上 ,， 也 就 是 说 ， 表 达 式 是 文字 的 AND 和 OR。 证 明 我 们 能 做 到 这 一 点 。 提 示 : 只 要 
看 到 NOT， 要 人 么 它 紧邻 男 一 个 NOT 之 上 (这 种 情况 下 可 以 根据 规则 12.13 抵 消 这 两 个 NOT ) ， 要 人 么 
它 在 命题 之 上 (这 种 情况 下 命题 就 得 到 满足 了 ) ， 再 或 者 它 在 AND 和 OR 之 上 (这 种 情况 下 可 以 利 
用 德 摩根 律 将 其 压 到 下 一 层 ) 。 不 过 ,， 想 通过 对 诸如 标号 为 NOT 的 节点 高 度 之 和 这 样 显 见 的 “大 
小 ”度量 进行 归纳 , 证 明 最 终 可 以 得 到 所 有 NoT 都 在 命题 之 上 的 等 价 表 达 式 , 是 不 可 能 行 得 通 的 。 
原因 在 于 ， 在 利用 德 摩根 律 将 NoT 回 下 压 时 ， 它 会 变 成 NoT ， 这 个 和 可 能 增加 。 为 了 证 明 最 终 可 
以 得 到 所 有 NoT 都 在 命题 之 上 的 等 价 表达 式 ， 需 要 找到 一 种 合适 的 “大 小 ”度量 ， 在 把 NoT 压 到 
RAND 或 OR 之 下 的 方向 上 应 用 德 摩根 律 时 ,这 个 大 小 度量 总 是 递减 的 。 找 到 这 样 的 大 小 度量 , 并 证 
明 该 声明 。 


12.9 重 言 式 及 证 明 方 法 


在 12.6 到 12.8 这 3 节 中 ， 我 们 已 经 看 到 了 逻辑 的 一 个 方面 : 它 作 为 设计 理论 的 用 途 。 在 12.6 
节 中 ， 我 们 看 到 如 何 利用 卡 诺 图 为 给 定 的 布尔 六 数 设计 表达 式 ， 而 在 第 13 草 中 我 们 会 看 到 这 种 
方法 论 是 如 何 用 到 开关 电路 设计 中 的 ， 而 开关 电路 是 构建 计算 机 和 其 他 数字 设备 的 基础 。12.7 
节 和 12.8 节 为 我 们 介绍 了 重 言 式 ， 它 们 可 以 用 来 简化 表达 式 ， 因 此 在 为 给 定 布尔 函数 设计 优质 
表达 式 时 ， 重 言 式 是 男 一 种 重要 工具 。 

逻辑 的 第 二 个 重要 用 途 将 在 本 节 中 得 到 体现 。 当 人 们 推理 或 证 明 数 学 命题 时 ， 他 们 会 用 到 
很 多 技巧 来 推进 自己 的 论证 ， 这 些 技 巧 包括 : 

(1) 情况 分 析 ; 

(2) 换 质 位 法 ; 

(3) 反 证 法 ; 

(4) 归 约 法 。 

本 节 中 要 定义 这 些 技 巧 ， 展 示 它 们 各 自 是 如 何 应 用 到 证 明 中 的 。 我 们 还 会 展示 如 何 通过 命 
题 逻辑 中 的 某 些 重 言 式 来 验证 这 些 技巧 。 


12.9.1 排 中 律 


首先 要 介绍 一 些 表 示 与 如 何 进行 推理 有 关 的 基本 事实 的 重 言 式 。 
12.25 排 中 律 : (p+ Pp)=1 是 重 言 式 。 
也 就 是 说 ， 某 事物 要 么 为 真 ， 要么 为 假 ， 不 存在 中 间 状 态 。 


+ 示例 12.22 
作为 法 则 12.25$ 的 应 用 ， 同 时 也 利用 到 我 们 目前 已 经 了 解 的 若干 其 他 法 则 ， 可 以 证 明 12.6 节 
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中 用 过 的 法 则 (pg+ Bg)=gq。 首 先 根据 法 则 12.1， 等 价 的 自发 性 ， 用 1 AND 4 替换 p， 就 有 
(1 AND g)= (1 AND gq) 
接着 ， 通 过 法 则 12.25， 可 以 “以 相等 换 相 等 ”用 p+F 蔡 换 上 式 左边 的 1， 因 此 
((p+7)q)= (1 AND 9) 
是 重 言 式 。 对 该 等 价 的 右边 使 用 法 则 12.10， 用 5 替换 1 AND g。 然 后 对 左边 ， 我 们 使 用 12.9，AND 
对 OR 的 分 配 律 ， 进 而 利用 法 则 12.5，AND 的 交换 律 ， 从 而 证 实 左 边 与 pg+ 9 等 价 。 因 此 有 
(pqg+ pq)=4q 





这 正 是 我 们 想 要 的 。 

将 排 中 律 一 般 化 ， 就 得 到 了 名 为 “情况 分 析 ”( case analysis ) 的 证 明 技巧 ， 其 中 我 们 想 证 
明 某 表达 式 E。 我 们 会 取 男 一 个 表达 式 F， 及 其 否定 NOTF， 并 证 明 F 和 NOT 了 都 缠 涵 E。 因 为 F 肯 
定 要 么 为 真 要 么 为 假 ， 所 以 我 们 就 得 出 了 E。 情 况 分 析 的 正式 依据 是 如 下 重 言 式 。 

12.26 情况 分 析 : ((p 一 gq)AND(P 一 g))=g。 

也 就 是 说 ， 这 两 个 实例 是 在 z 为 真 和 Z 为 假 时 发 生 的 。 如 果 4 被 两 个 实例 蕴涵 ， 那 么 4 一 定 为 
真 。 我 们 把 证 明 12.26 可 由 12.25 和 其 他 已 证 明 的 法 则 得 出 这 一 任务 留 作 本 节 习 题 。 

12.27 pp=0 

命题 及 其 否定 不 可 能 同时 为 真 。 这 一 法 则 在 使 用 “ 反 证 法 ”时 显得 至 关 重 要 。 我 们 很 快 就 
会 在 法 则 12.29 中 讨论 这 一 证 明 技巧 ， 而 且 在 12.11 介 绍 分 解 证 明 时 也 要 提 及 。 


12.9.2” 换 质 位 法 


有 时 候 我 们 想 要 证 明 p 一 9 这 样 的 草 涵 ， 却 发 现 证 明了 一 万 这 一 被 称 为 疡 一 9 的 质 位 变换 
命题 的 等 价 表达 式 要 更 加 简单 。 这 一 原则 可 以 用 如 下 法 则 公式 化 。 
12.28 质 位 变换 法 则 〈contrapositive law ): (p 一 g)=(9 一 也)。 














+ 示例 12.23 

我 们 来 考虑 一 个 简单 的 例子 ， 向 大 家 展示 可 以 如 何 利 用 质 位 变换 法 则 。 这 个 示例 还 表现 了 
命题 逻辑 在 证 明 过 程 中 的 局 限 。 逻 辑 只 能 完成 部 分 工作 ， 人 允许 我 们 在 不 参考 命题 本 身 含 义 的 情 
况 下 对 命题 进行 推理 。 不 过 ， 要 得 到 完整 的 证 明 ， 通 常 还 必须 指定 一 些 参 数 ， 让 它们 指 代 各 项 
的 含义 。 对 本 例 来 说 ， 我 们 需要 知道 像 “ 质 数 “ “奇数 ”和 “大 于 ”这 样 与 整数 有 关 的 概念 的 
会 义 是 什么 。 


我 们 要 考虑 下 面 3 个 与 正 整数 x 有 关 的 命题 











a “x>2” 
x 是 质数 ” 
c “x 是 奇数 ” 


我 们 想 要 证 明 的 定理 就 是 ab 一 c ， 也 就 是 

命题 “如 果 x 大 于 2 有 是 是 质数 ,那么 x 是 奇数 。” 

首先 要 应 用 已 经 了 解 的 一 些 法 则 ,将 表达 式 ab 一 c 变形 为 更 方便 证 明 的 等 价 表达 式 。 首 先 ， 
我 们 要 利用 法 则 12.28 将 其 变 成 质 位 变换 命题 的 形式 = 一 NoT(ap) 。 然 后 利用 德 摩根 律 12.20(a) 
将 NoT(ab) 变形 为 a+b 。 也 就 是 说 ， 可 以 把 该 定理 变形 为 一 (4+5b) 。 换 句 话说， 需要 证 明 
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命题 “如 果 x 不 是 奇数 ， 那 么 它 要 么 不 大 于 2， 要 么 不 是 质数 。” 
我 们 可 以 把 “不 是 奇数 ”替换 为 “是 偶数 ",“ 不 大 于 2” 替 换 成 “小 于 等 于 2”， 并 把 “不 是 质数 ” 
替换 为 “是 合 数 "。 因 此 要 证 明 的 是 

命题 “如 果 x 是 偶数 ， 则 要 么 有 x<2， 要 么 有 x 是 合 数 。” 

现在 已 经 将 命题 逻辑 应 用 到 极致 了 ， 接 下 来 必须 开始 谈论 这 些 项 的 含义 了 。 如 果 x 为 偶数 ， 
那么 对 某 个 整数 y 而 言 有 x=2y ， 这 也 就 是 z 为 偶数 的 含义 。 因 为 在 该 证 明 中 假设 了 :为 正 整数 ， 
所 以 一定 是 大 于 等 于 1 的 。 

现在 可 以 使 用 情况 分 析 了 ， 分 别 考 虑 y=1 和 y>1 这 两 种 情况 ， 因 为 我 们 论证 过 y 宇 1， 所 
以 这 是 仅 有 的 两 种 情况 。 如 果 y=1 ， 那 么 x=2 ， 这 样 就 证 明了 x 三 2 。 如 果 y>1 ， 那 么 x 是 2 
和 y 这 两 个 都 大 于 1 的 整数 的 积 ， 这 就 表示 x 是 合 数 。 因 此 我 们 证 明了 ， 如 果 x 是 偶数 ， 那 么 要 么 
有 x 三 2 (在 y=1 情 况 下 )， 要 么 有 x 是 合 数 (在 y>1 的 情况 下 )。 


12.9.3 ” 反 证 法 


我 们 经 常 不 是 “直接 ”证 明 表 达 式 已 ， 而 是 利用 更 简单 的 方式 ， 首 先 假 设 NoT 已 ， 然 后 利用 
矛盾 (也 就 是 表达 式 FALSE ) 进行 证 明 。 这 种 证 明 的 依据 是 以 下 重 言 式 。 

12.29 反 证 法 : (一 0)=p。 

粗略 地 讲 ， 如 果 由 五 可 以 得 出 0， 也 就 是 得 出 FALSE 或 引起 了 矛盾， 就 和 证 明了 7 是 一 样 的 。 
这 一 条 法 则 其 实 是 由 其 他 法 则 得 出 的 。 如 果 用 5 替换 法 则 12.24 中 的 p， 用 0 替代 其 中 的 g， 就 得 
到 如 下 等 价 











(B=0)=(NOT(P)+0) 
根据 法 则 12.13 ， 双 重 和 否定 可 以 抵消 ， 于 是 就 可 以 把 NOT(DT) 奉 换 为 p， 这 样 就 有 了 
(五 一 0)=(P+0) 
而 法 则 12.11 告 诉 我 们 ，(p+0)= p ， 进 一 步 蔡 换 就 得 出 了 
(Pp 0)=p 


+ 示例 12.24 

现在 重新 考虑 一 下 示例 12.23 中 的 命题 a、b、c， 在 这 里 例子 中 我 们 假设 x 是 正 整 数 ， 并 分 别 
断言 x*>2 、x 是 质数 、x 是 奇数 。 我 们 想 要 证 明定 理 ab 一 c ,因此 可 以 用 该 表达 式 蔡 换 法 则 12.29 
中 的 P。 那 么 五 人 0 就 成 了 (NoT(ab 一 c) 一 0。 

如 果 对 第 一 个 蕴涵 使 用 法 则 12.24， 就 得 到 

(NOT(NOT(ab)+c))—0 
对 里 层 的 NoT 应 用 德 摩根 律 就 得 到 (NOT(a +b +o)) 一 0 。 再 次 利用 德 摩根 律 ， 并 两 次 利用 法 则 
12.13 消 除 双 重 和 否定 ， 就 将 该 表达 式 变 成 了 (cpc) 一 0。 

这 就 是 命题 逻辑 所 能 做 到 的 极限 了 , 现在 必须 进行 与 整数 有 关 的 推理 。 我们 必须 从 a、b 和 志 
开始 ， 并 得 出 矛盾 。 换 句 话 说， 首先 要 假设 之 2 ，x 是 质数 ， 而 且 x 是 偶数 ， 并 一 定 要 从 这 些 假 
设 中 得 出 矛盾 。 

因为 x 是 侦 数 ， 所 以 可 以 说 对 某 个 整数 y 而 言 有 x=2y 。 因 为 之 2 ， 就 一 是 有 ) 过 2 。 不 过 
这 样 一 来 ， 等 于 27 的 x 就 是 两 个 大 于 1 的 整数 的 积 ， 也 就 是 说 x* 是 个 合 数 。 因 此 就 证 明了 x 不 是 质 
数 ， 也 就 是 命题 。 因 为 给 定 了 bp， 也 就 是 x 是 质数 ， 现 在 又 有 了 5b ， 这样 就 有 了 bb ， 而 根据 法 
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则 12.27， 它 是 等 于 0， 或 者 说 为 FALSE 的 。 

于 是 证 明了 (NoOT(ab 王 c)) 一 0， 根据 法 则 12.29 这 就 等 价 于 ab 一 c 。 这 样 也 就 完成 了 反 证 
法 证 明 。 
12.9.4 ”等 价 于 真 

下 一 种 证 明 方 法 让 我 们 可 以 通过 以 相等 换 相 等 ， 直 到 表达 式 归 约 为 1 (TRUE ), 证 明 该 表达 
让 是 重 言 起。 

12.30 通过 等 价 于 真 证 明 : (p=1)=p。 





+ 示例 12.25 
表达 式 rs 一 r+ 表示 ， 两 个 表达 式 的 AND 强 涵 了 第 一 个 表达 式 ( 而 且 根 据 AND 的 交换 律 ， 也 
蕴涵 了 第 二 个 表达 式 )。 可 以 通过 以 下 一 系列 等 价 证 明 rs 一 ” 是 个 重 言 式 。 
rs—>r 
1)==NOT(rs)+r 
2)=(7+5s)+r 
3)=1+3 
4)=1 
应 用 法 则 12.24, 用 AND 和 oR 定义 一 ,得 到 (1)。 应 用 德 摩根 律 得 出 (2)。 利用 法 则 12.7 和 12.8， 
重新 排列 各 项 ， 然 后 根据 法 则 12.25 用 1 替代 r+ ， 就 得 到 了 (3)。 最 后 ， 应 用 法 则 12.13，1 是 OR 
的 零 元 ， 这 样 就 有 了 (4)。 


12.9.5 “习题 


(1) 证 明 法 则 12.25 和 12.27 是 相互 对 偶 的 。 
(2)* 我 们 想 证 明定 理 “ 如 果 x 是 完全 平方 数 而 且 x* 是 偶数 ， 那 么 xz 可 以 被 4 整除 。” 
(a) 指定 代表 该 定理 中 提 到 的 3 个 有 关 x 的 条 件 的 命题 变量 。 
(b) 把 该 定理 用 这 些 命题 正式 地 表示 出 来 。 
(c) 用 命题 变量 的 形式 和 口头 描述 的 形式 给 出 (b) 小 题 得 到 命题 的 质 位 变换 命题 。 
(d) 证 明 (c) 小 题 得 到 的 命题 。 提示 : 要 注意 到 , 如 果 x 不 能 被 4 整除 , 那么 要 么 x 是 奇数 , 要 么 x=2y 
且 y 是 奇数 。 
(3)* 用 反 证 法 证 明 习 题 (2) 中 的 定理 。 
(4)* 针对 有 关 整 数 x 的 命题 “如 果 x 是 奇数 ,那么 x 是 奇数 ”， 重复 习题 (2) 和 习题 (3) (不 过 在 习题 (2) 
的 (a) 小 题 中 只 讨论 了 两 种 情况 ) 。 
(5)* 通过 证 明 以 下 表达 式 等 价 于 1 (TRUE ) ， 证 明 它 们 是 重 言 式 。 
(a) pqg+r+qr+pr 
(b) p+qr+prt+gr 
(6) * 通过 对 之 前 已 经 证 明 的 法 则 ( 的 实例 ) 进行 以 相等 换 相 等 ， 证 明 法 则 12.26: 情况 分 析 。 
(7)* 将 情况 分 析 法 则 一 般 化 为 由 k 个 命题 变量 定义 情况 的 情形 , 这 些 变量 在 所 有 2 个 组 合 中 可 能 为 真 
或 为 假 。 那 么 验证 上 = 2 的 情况 的 重 言 式 是 什么 ”对 一 般 的 隶 说 呢 ? 证 明 该 重 言 式 为 何 一 定 为 真 。 

















12.10 ”演绎 


我 们 在 12.6 节 到 12.8 节 中 看 到 了 作为 设计 理论 的 逻辑 , 并 在 12.9 节 中 看 到 了 作为 证 明 技 巧 的 
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逻辑 。 现 在 ,我 们 要 看 看 逻辑 的 第 三 面 : 逻辑 在 演绎 中 的 使 用 。 演 绎 就 是 可 以 构成 完整 证 明 的 
一 系列 命题 -学 习 过 平面 几何 的 话 就 应 该 对 演绎 证 明 很 熟悉 ,在 演绎 证 明 中 我 们 从 某 些 前 提 (“ 给 
定 条 件 ”) 开始 , 并 经 过 一 系列 步骤 证 明 结 论 ,， 其 中 每 一 步 都 是 由 前 一 个 步骤 经 过 有 限 次 数 的 推 
理 〈 称 为 推理 规则 ) 得 到 的 。 我 们 在 本 节 中 会 解释 演绎 证 明 的 构成 ， 并 给 出 奉 干 示例 。 

不 巧 的 是 ， 为 重 言 式 找到 演绎 证 明 是 很 难 的 。 正 如 我 们 在 12.7 市 中 提 过 的 ， 这 是 个 “固有 
的 难 解 ”问题 ， 是 属于 NP 困难 问题 一 类 的 。 因 此 要 找到 演绎 证 明 ， 要 么 徘 运 气 ， 要 人 么 就 要 穷 举 
查找 。 在 12.11 市 中 ， 我们 会 讨论 分 解 证 明 ， 虽然 在 最 坏 情 况 下 它 和 其 他 技巧 一 样 也 必须 花 上 指 
数 时 间 ， 但 它 看 起 来 是 对 寻找 证 明 方法 的 一 种 好 的 探索 。 


12.10.1 演绎 证 明 的 构成 




















演绎 的 应 用 


除了 作为 数学 证 明 的 根本 组 成 ， 演 绎 证 明 或 者 说 形式 证 明 在 计算 机 科学 中 也 有 很 多 用 
途 。 应 用 之 一 是 自动 证 明定 理 (automatedtheorem proving )。 存在 一 些 这 样 的 系统 : 通过 搜 
索 从 前 提 行 进 到 结论 的 步骤 序列 ,从 而 确定 定理 的 证 明 过 程 。 有 些 系统 会 自行 查找 证 明 ， 而 
另 一 些 则 会 与 用 户 进行 交互 ,接受 提示 并 填补 构成 证 明 的 步骤 序列 中 存在 的 小 间 阶 。 有 人 认 
为 ， 虽 然 要 让 这 样 的 系统 投入 实际 使 用 还 有 很 长 的 路 要 走 , 但 它们 最 终 可 以 用 于 证 明 程 序 的 
正确 性 。 

演绎 证 明 的 第 二 个 用 途 是 用 在 与 推导 计算 相关 的 编程 语言 中 。 举 个 简单 的 例子 , 机 器 人 在 
寻找 通过 迷宫 的 路 径 时 ,可 以 把 可 能 的 状态 用 通道 中 心 位置 的 有 限 集 表 示 出 来 。 我 们 可 以 绘制 
一 幅 图 , 其 中 的 节点 表示 这 些 位 置 ,而 陶 w 一 >v 就 意味 着 机 器 人 可 以 从 位 置 u 直 接 前 移 到 位 置 y， 
因为 u 和 Vv 表示 的 是 邻接 的 通道 。 

还 可 以 把 这 些 位 置 想象 成 命题 ， 其 中 x 代 表 “ 机 器 人 可 以 到 达 位 置 xe ”那么 4 一 v 就 不 仅 
能 被 解释 为 一 条 释 ， 还 可 以 解释 为 一 种 逻辑 蕴涵 ， 也 就 是 说 “如 果 机 器 人 可 以 到 达 x， 那 么 它 
可 以 到 达 v。”( 请 注意 这 里 的 “双关 "”， 箭 头 符号 既 可 以 表示 弧 ， 也 可 以 表示 蕴涵 。) 我 们 很 自 
然 地 要 问 :“ 机 器 人 从 位 置 g 可 以 到 达 哪 些 位 置 ?” 

如 果 取 表达 式 4q， 以 及 所 有 对 应 邻接 位 置 u 和 v 的 表达 式 u 一 v 作为 前 提 ， 看 看 可 以 从 这 些 
前 提 证 明 哪 些 命题 变量 x， 就 可 以 把 该 问题 用 演绎 的 形式 表示 出 来 。 在 这 种 情况 下 ,我 们 并 非 
真正 需要 像 演绎 证 明 这 般 强大 的 工具 ， 因 为 正如 在 9.7 节 中 讨论 过 的 ， 深 度 优先 搜索 就 能 完成 
任务 。 不 过 ， 还 有 很 多 相关 的 情形 ， 使 用 图 论 方 法 不 是 很 有 效率 ， 但 问题 可 以 用 演绎 的 形式 表 
示 ， 并 得 到 合理 的 解决 方案 。 





假设 给 定 了 某 些 逻辑 表达 式  、E,、…、E 作为 前 提 , 并 希望 得 出 形 如 男 一 个 逻辑 表达 式 E 
的 结论 。 一 般 来 说 ， 结 论 和 前 提 都 不 会 是 重 言 式 ， 不 过 我 们 想 要 证 明 
(EAND bE, AND…AND 天 OE (12.11) 
是 个 重 言 式 。 也 就 是 说 ， 想 要 证 明 ， 如 有 果 前 提包 、B,、…、E, 为 真 ， 就 能 得 到 E 为 真 。 
一 种 证 明 (12.11) 的 方式 就 是 为 其 构造 真 值 表 , 并 检验 其 中 各 行 是 否 都 是 1， 这 是 验证 重 言 式 
的 例 行 检验 。 不 过 ， 出 于 如 下 两 个 原因 ， 这 样 可 能 并 不 足够 。 
(1) 正如 上 文 提 过 的 ， 如 果 表 达 式 中 存在 太 多 的 变量 ， 重 言 式 的 检验 就 会 变 得 非常 环 手 。 
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(2) 更 重要 的 是 ,尽管 重 言 式 的 验证 对 命题 逻辑 来 说 能 起 效 , 但 它 不 能 检验 更 复杂 逻辑 系统 
(比如 第 14 草 中 将 要 讨论 的 谓词 逻辑 ) 中 的 重 言 式 。 

通 和 可 以 通过 给 出 演绎 证 明 来 证 明 (12.11) 是 重 言 式 。 演 绎 证 明 是 奋 干 行 组 成 的 序列 ， 每 一 
行 要 么 是 给 定 的 前 提 ， 要 么 是 由 之 前 的 一 行 或 多 行 根据 推理 规则 构造 出 来 的 。 如 果 最 
E， 就 说 这 是 从 互 、E,、…、 太 ,证 明了 E。 

可 以 使 用 的 推理 规则 有 很 多 。 唯 一 的 要 求 就 是 ， 如 果 推 理 规则 允许 我 们 只 要 有 表达 式 五 、 
互 、…、 古 ,是 证 明 中 的 行 ， 就 可 以 把 表达 式 F 号 为 一 行 ， 就 有 

(FANDF, AND…AND 天 OF 











一 年 是 重 言 式 。 例 如 ， 

(a) 任何 重 言 式 都 可 以 用 作证 明 中 的 一 行 ， 而 不 管 前 面 的 行 是 什么 。 这 一 规则 成 立 的 原因 在 
于 ， 如 果 F 是 重 言 式 ， 那么 证 明 中 0 行 的 AND 曾 涵 了 F。 请 注意 ,按照 约定 ，0 个 表达 式 的 
AND 是 1， 而 当 有 为 重 言 式 时 ，1 一 下 就 是 重 言 式 。 

(b) 肯定 前 件 式 假 言 推 理 ( modus ponens ) 的 规则 是 说 ， 如 果 E 和 EE 一 F 是 证 明 中 的 行 ， 就 
可 以 把 F 添 加 为 证 明 的 行 。 肯定 前 件 式 假 言 推理 是 由 重 言 式 (p AND (p 一 9)) 一 9 得 出 
的 ， 这 里 是 用 表达 式 E 代 蔡 了 p 并 用 F 代 蔡 了 q。 唯 一 的 微妙 之 处 在 于 ， 我 们 不 需要 E AND 
E 一 这样 一 行 ， 而 是 需要 单独 的 两 行 ， 一 行 是 EF， 一行 是 EE 一 下。 

(c) 如 果 E 和 是 证 明 中 的 两 行 ， 那么 可 以 添加 一 行 & AND fF。 这样 做 可 行 的 原因 在 于 
(p AND g) 一 (p AND 9) 重 言 式 ， 可 以 用 任意 表达 式 E 葵 换 p， 用 F 蔡 换 y。 

(d) 如 果 有 E 和 E= 五 这 两 行 , 那么 可 以 添加 一 行 。 可 以 这 样 做 的 原因 类 似 于 肯定 前 件 式 假 
言 推理 ,是 因为 £= 玉 蕴涵 一 FF。 也 就 是 说 ，(p AND (P=g)) 一 4 是 重 言 式 ， 而 推理 
规则 (gd) 是 该 重 言 式 可 替换 出 的 实例 。 



































无 人 喝彩 的 声音 


我 们 常常 需要 理解 为 0 个 操作 数 应 用 运算 符 的 极限 情况 ,就 像 在 推理 规则 (a) 中 所 做 的 那样 。 
我 们 断言 ， 可 以 把 0 个 表达 式 (或 证 明 中 的 行 ) 的 AND 当 作 具 有 真 值 1。 这 样 的 动机 在 于 ， 除 非 
厂 、 忆 、…、 丰 中 有 一 个 为 假 ， 否 则 AND 丰 AND…AND 丰 为 真 。 但 是 如 果 n=0， 也 就 是 一 
个 F 都 没有 ， 那 么 该 表达 式 就 不 可 能 为 假 ， 因 此 很 自然 地 将 0 个 表达 式 的 AND 取 为 1。 

我 们 要 作出 这 样 一 个 约定 ， 只 要 对 0 个 操作 数 应 用 运算 符 ， 得 到 的 结果 就 应 该 是 该 运算 符 
的 单位 元 。 因 为 可 以 预见 0 个 表达 式 的 OR 是 0, 因为 只 要 其 中 有 一 个 表达 式 为 真 ， 多 个 表达 式 的 
OR 就 为 真 。 同 样 ，0 个 数字 之 和 被 取 为 0， 而 0 个 数字 之 积 则 被 取 为 1。 





+ ”示例 12.26 
假设 我 们 具有 如 下 命题 变量 ， 具 有 表 中 所 示 的 直觉 含义 。 








r “天 在 下 雨 。” 
u “ 乔 伊 带 着 企 。” 
w “ 乔 伊 被 淋 湿 了 。” 


给 定 以 下 前 提 
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Re “天 在 下 雨 ， 乔 伊 就 会 带 着 伴 。” 
“ 乔 伊 带 着 企 ， 所 以 他 没 被 淋 温 。” 
二 “如 果 没 下 雨 ， 乔 伊 是 不 会 被 淋 湿 的 。” 


现在 要 求证 明 w， 也 就 是 ， 乔 伊 绝 不 会 被 淋 湿 。 从 某 种 意义 上 讲 ， 这 个 问题 不 值 一 提 ， 因 为 大 
家 可 以 验证 
(ruANDu oO WAND(F OW)) ow 

是 个 重 言 式 。 不 过 ， 还 是 可 以 利用 12.8 市 介绍 的 一 些 代 数 法 则 ， 以 及 刚刚 讨论 过 的 一 些 推理 规 
则 ， 从 前 提 证 明 w。 如 果 要 处理 形式 比 命题 逻辑 更 为 复杂 的 逻辑 ,或 者 是 要 人 处理 涉及 很 多 变量 
的 逻辑 表达 式 ， 就 需要 采取 这 种 证 明 方 式 。 图 12-24 展 示 了 一 种 可 能 的 证 明 方 式 ， 以 及 每 个 步 又 
进行 下 去 的 依据 。 

这 种 证 明 的 大 概 思 路 是 ， 利 用 情况 分 析 ， 考 虑 天 在 下 雨 及 没 下 雨 这 两 种 情况 。 根 据 第 (5) 行 
我 们 就 证 明了 ， 如 果 天 在 下 雨 ， 那 么 乔 伊 不 会 被 淋 湿 ， 而 根据 第 (9) 行 ， 由 给 定 的 前 提 ， 说 明 如 
果 没 下 雨 ， 乔 伊 就 不 会 被 淋 湿 。 第 (7) 到 第 (9) 行 结合 了 这 两 种 情况 ， 以 得 到 我 们 想 要 的 结论 。 








ru 前 提 

UD 前 提 

(7 = wu) AND (wu — 3) 对 (1) 和 (2) 应 用 推理 规则 (c) 

((7 一 4) AND (4 一 可)) 一 (一 陷 ) 对 法 则 (12.23) 进 行 替换 
肯定 前 件 式 假 言 推理 ， 以 及 (3) 和 (4) 





‘O00 
4 
-9 
SI 


Fw 前 提 

(7 — 1W) AND (7 — TD) 对 (3) 和 (6) 应 用 推理 规则 (c) 
((r = w) AND (7 —» w)) = 0 对 法 则 (12.26) 进 行 奉 换 

w 推理 法 则 (d)， 以 及 (7) 和 (8) 





图 12-24 ”演绎 证 明 的 示例 


12.10.2 ”演绎 证 明 “ 起 作用 ”的 原因 


回想 一 下 ， 演 绎 证 明 首 先 有 前 提 互 、E,、…、E, 并 要 添加 额外 的 行 (也 就 是 表达 式 )， 这 
些 行 都 更 涵 上 自己 AND 书 AND…AND 已 。 我 们 所 添加 的 每 一 行 都 列 涵 目 之 前 的 0 条 或 更 多 行 ， 或 者 
是 某 一 行 前 提 。 我 们 可 以 通过 对 目前 为 止 已 经 添加 的 行 的 数目 进行 归纳 , 来 证 明 EAND E, AND… 
AND E, 草 涵 了 证 明 过 程 中 的 每 一 行 。 要 完成 这 一 任务 ， 需 要 两 个 涉及 语言 的 重 言 式 族 。 第 一 个 
重 言 式 族 是 从 一 的 传递 性 一 般 化 而 来 的 。 对 任何 %x"， 有 : 

((p 4) AND (pq,) AND…RAND (p —» 9,) AND (9 9) 一 让) 一 (一 门 (12.12) 
也 就 是 说 ， 如 果 p 蕴 涵 了 各 个 gq, ， 而 且 g, 一 起 蕴涵 rx， 那么 有 p 缠 涵 r。 

我 们 可 以 通过 以 下 推理 得 出 (12.12) 是 重 言 式 。(12.12) 为 假 的 唯一 可 能 就 是 p 一 7 为 假 ， 而 
且 左 边 那 一 串 为 真 。 不 过 一 r+ 只 能 在 p 为 真 且 /为 假 时 为 假 ， 所 以 我 们 要 假设 p 和 为 真 。 然 后 
必须 证 明 (12.12) 的 左边 为 假 。 

如 果 (12.12) 的 左边 为 真 , 那么 其 中 由 AND 连 接 的 各 个 子 表达 式 都 为 真 。 例 如 ， 一 9 为 真 。 
因为 我 们 假设 p 为 真 , 那么 要 让 p 一 qi 为 真 , 就 只 可 能 是 gq 为 真 。 同样 ,可 以 得 出 结论 : q，、'…、 
q, 部 为 真 。 因 此 qq,…gq, 一 7 一 定 为 假 ， 因 为 我 们 假设 为 假 ， 而 且 刚 刚 发 现 所 有 的 9 都 为 真 。 
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首先 假设 (12.12) 为 假 ， 因 此 得 到 右边 一 定 为 真 ， 所 以 p 和 都 为 真 。 然 后 可 以 得 出 ， 当 p 为 
真是 7 为 假 时 ，(12.12) 的 左边 为 假 。 但 如 果 (12.12) 的 左边 为 假 ， 则 (12.12) 本 身 为 真 ， 这 样 就 得 出 
了 了 矛盾 。 因 此 (12.12) 绝 不 可 能 为 假 ， 所 以 它 是 重 言 式 。 

要 注意 到 ， 如 果 (12.12) 中 有 n=1, 就 有 了 一 的 传递 性 的 情况 ,也 就 是 法 则 12.23。 还 有 ， 如 
果 n=0 ,那么 (12.12) 就 成 了 (1 一 r+) 一 +, 这 是 个 重 言 式 。 回想 一 下 , 当 n=0 时 , 按 约定 qq,…9g， 
被 取 为 AND 的 单位 元 ， 也 就 是 1。 

我 们 还 需要 一 类 重 言 式 来 证 实 可 以 为 证 明 添 加 前 提 。 它 是 对 示例 12.25 中 讨论 过 的 重 言 式 的 
一 般 化 。 我 们 声明 ， 对 任何 满足 1i 志 m 的 m 和 坏 说 ， 

(pips*% pn) PD; (12.13) 
是 重 言 式 。 也 就 是 说 ， 一 个 或 多 个 命题 的 AND 列 涵 它 们 之 中 的 任何 一 个 。 

表达 式 (12.13) 之 所 以 是 重 言 式 , 是 因为 唯一 让 它 为 假 的 可 能 就 是 左边 为 真 且 右边 ( p,) 为 假 。 
但 如 果 疡 为 假 , 那么 p, 和 其 他 p 的 AND 必 然 为 假 ， 所 以 (12.13) 的 左边 为 假 。 但 只 要 (12.13) 的 左边 
为 假 ， 它 就 为 真 。 

现在 可 以 证 明 ， 如 果 给 定 下 列 两 个 条 件 

(1) 前 提 、E,、…、E,; 

(2) 一 组 推理 规则 ,满足 只 要 这 些 推 理 规则 允许 我 们 写 一 行 ， 那 么 该 行 要 么 是 5, 中 的 某 一 
个 ， 要么 对 某 组 之 前 的 行 万 、 态 、…、 厂 ， 存 在 重 言 式 

(FE AND Ph AND:…AND FPF)— Or 
则 对 各 行 ，(B AND E, AND…AND E,) 刁 了 了 一定 是 重 言 式 。 要 对 添加 到 证 明 中 的 行 的 数量 进行 
归纳 。 

依据 。 我 们 以 0 行 的 情况 作为 依据 。 这 一 命题 成 立 ， 因 为 它 表 示 的 是 与 证 明 中 每 行 F 有 关 的 
言 息 ， 而 且 并 没有 这 样 的 行 需要 讨论 。 也 就 是 说 ， 我 们 的 归纳 命题 其 实 形 如 “如 果 及 为 证 明 的 
一 行 ， 那 么 ……”， 而 且 我 们 知道 如 果 条 件 为 假 ， 那 么 这 样 的 “如 果 - 那 么 ”命题 就 为 真 。 

归纳 。 对 归纳 部 分 而 言 ， 假 设 对 之 前 的 各 行 C， 有 

(局 AND E, AND:..AND FE,)— OG 
是 重 言 式 。 设 是 添加 的 下 一 行 。 就 有 两 种 情况 。 























演绎 证 明 与 等 价 证 明 


我 们 在 12.8 节 和 12.9 节 中 看 到 的 证 明 方式 与 12.10 节 研究 的 演绎 证 明 有 着 不 同 的 风格 。 不 
过 ， 这 两 种 证 明 都 需要 构建 一 系列 的 重 言 式 ， 以 得 出 所 需 的 重 言 式 。 

在 12.8 节 和 12.9 节 中 我 们 看 到 了 等 价 证 明 ， 由 一 个 重 言 式 开始 ， 通 过 各 种 替换 得 出 另外 的 
重 言 式 。 得 到 的 所 有 重 言 式 对 茶 些 表达 式 和 而 言 具 有 = 的 形式 。 这 种 证 明 风 格 会 被 用 于 
三 角 学 中 ,例如 ， 在 证 明 “ 三 角 恒等式 ”时 会 用 到 。 

演绎 证 明 也 需要 寻找 重 言 式 。 唯 一 的 区 别 在 于 ， 其 中 各 个 重 言 式 都 形 如 一 ， 其 中 是 
前 提 的 AND， 而 F 是 证 明 中 我 们 实际 要 得 出 的 行 。 事实 上 ,我们 不 写 出 整个 重 言 式 只 是 一 种 表示 
上 的 便利 , 而 非 本 质 上 的 区 别 。 我 们 也 应 该 很 熟悉 这 种 证 明 方 式 , 它 常用 于 平面 几何 中 的 证 明 ， 





情况 1: F 是 前 提 之 一 。 那么 (5 AND E, AND…AND 无 ) 一 下 是 重 言 式 ， 因 为 它 源 自 (12.13)， 
是 m=k ， 而 且 对 j = 1、2、…*、k， 用 ,替换 各 个 忆 得 到 的 。 
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情况 2: Ff 是 因为 推理 规则 
(F AND 已 AND.….AND F,)—» Fr 
而 被 添加 的 ， 其 中 各 个 都 是 之 前 各 行 中 的 某 一 行 。 根 据 归纳 假设 
(E AND E, RND…RAND E,) oR, 
对 各 个 而 言 都 是 重 言 式 。 因 此 ， 如 果 用 忆 替换 (12.12) 中 的 g ， 用 
E RND E, RND.…RAND E, 
代替 p， 并 用 瑚 代 赫 ,我 们 就 会 知道 ， 对 表达 式 E 和 F 中 变量 的 真 值 进行 任何 替换 ， 都 会 使 (12.12) 
的 左边 为 真 。 因 为 (12.12) 是 重 言 式 ， 所 以 每 一 种 真 值 赋值 都 会 让 右边 为 真 。 而 这 里 的 右边 是 
(已 AND E, AND…AND EB,) 一 F 。 由 此 可 以 得 出 ， 该 表达 式 对 每 种 真 值 赋值 都 为 真 ， 也 就 是 说 ， 
全 是 个 宣言 式 。 
我 们 现在 已 经 得 出 了 归纳 的 结论 ， 而 且 证 明了 对 证 明 中 的 每 行 都 有 
(E, AND E, AND:..AND E,) OF 
特别 要 说 的 是 ， 奉 证 明 中 最 后 的 那 行 是 我 们 的 目标 Z， 就 知道 (& AND E, AND…RAND 书 ) 一 已 。 


12.10.3 “习题 


(1)* 从 下 列 各 小 题 给 出 的 前 提 ， 分 别 给 出 对 相应 结论 的 证 明 。 大 家 可 以 使 用 推理 规则 (a) 到 (d)。 而 对 
于 重 言 式 ， 只 可 以 使 用 12.8 节 和 12.9 节 中 陈述 过 的 法 则 ,以 及 用 “以 相等 换 相 等 ”的 方式 从 这 些 法 
则 的 实例 得 到 的 重 言 式 。 

(a) 前 提 : p 一 g ，p 一 r。 结论 : p 一 gr。 
(b) 前 提 : p 一 (q+r) ，p 一 (4+7)。 结 论 : p 一 gq。 
(c) 前 提 : p 一 g ，gr 一 s。 结 论 : gr 一 s。 

(2) 说 明 以 下 内 容 为 何 是 推理 规则 。 如 果 一 下 是 证 明 的 一 行 ， 而且 G 是 任何 表达 式 ， 那 么 我 们 可 以 

添加 一 (F OR G) 这 样 一 行 。 


























12.11 分解 证 明 


正如 我 们 在 本 章 前 面 的 内 容 中 提 过 的 ， 寻 找 证 明 是 个 困难 问题 ， 而 且 因为 重 言 式 问题 看 起 
来 是 天 生 的 指数 时 间 问 题 ， 所 以 没有 通行 的 方式 可 以 使 寻找 证 明 变 得 简单 。 不 过 ， 有 很 多 已 知 
的 只 针对 “典型 ” 重 言 式 的 技巧 ， 看 起 来 对 找寻 证 明 所 需 的 探索 工作 有 所 帮助 。 在 本 节 中 我 们 
就 要 研究 一 条 实用 的 推理 规则 一 一 分 解 (resolution ), 它 可 能 是 这 些 技巧 中 最 基本 的 一 条 了 。 分 
解 是 基于 以 下 重 言 式 的 。 

















(CP+9)( 互 + 门 ) (q+7) (12.14) 

这 条 推理 规则 的 有 效 性 是 很 容易 验证 的 。 想 让 它 为 假 只 有 一 种 情况 ,就 是 g+r 为 假 ， 而 且 左 边 
的 表达 式 为 真 。 如 果 g+r 为 假 ， 那 么 g 和 7 都 为 假 。 假 设 z 为 真 ， 则 五 为 假 。 那 么 五 +7 为 假 ， 而 
(12.14) 的 左边 就 一 定 为 假 。 同 样 ， 如 果 p 为 假 ， 那么 p+9g 为 假 ， 还 是 说 明 (12.14) 的 左边 为 假 。 
因此 ， 不 可 能 让 (12.14) 的 左边 为 真 且 右 边 为 假 ， 所 以 可 以 得 出 (12.14) 是 个 重 言 式 。 

应 用 分 解 的 一 般 方式 是 把 前 提 和 转换 成 子 句 ， 这 些 子 句 是 文字 的 和 (逻辑 oOR )。 我 们 可 以 把 
各 个 前 提 都 转换 成 子 句 的 积 。 而 我 们 的 证 明 要 以 这 些 子 句 作 为 证 明 中 的 行 开始 ， 这 样 做 的 原因 
是 各 子 句 都 是 “给 定 的 ”。 然 后 应 用 分 解 规则 构造 新 的 行 , 而 这 些 行 总 能 证 明 是 子 句 。 也 就 是 说 ， 
如 果 (12.14) 中 的 g 和 7 各 自 被 任意 文字 和 所 替代 ,那么 4+7 也 将 是 文字 和 。 
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在 实际 应 用 中 ,我 们 将 通过 删除 重复 来 简化 子 句 。 也 就 是 说 ， 如 果 gq 和 7x 都 包含 文字 X， 这 种 
情况 下 就 要 从 g+r 中 删除 X 的 一 个 副本 。 之 所 以 可 以 这 样 做 ， 是 因为 有 法 则 12.17、12.7 和 12.8， 
也 就 是 OR 的 窜 等 性 、 交 换 律 和 结合 律 。 一 般 而 言 ， 实 用 的 看 法 是 把 子 句 看 作文 字 的 集合 ， 而 非 
文字 的 列表 。 结 合 律 和 交换 律 让 我 们 可 以 按照 任意 方式 排列 文字 ， 而 害 等 性 则 让 我 们 可 以 消除 
重复 。 

还 要 消除 那些 含有 互 斥 文字 的 子 句 。 也 就 是 说 和 和 志 在 一 个 子 句 中 出 现 ， 那 么 利用 法 则 
12.25、12.7、12.8 和 12.15， 该 子 句 等 价 于 1， 就 不 需要 在 证 明 中 包含 该 子 句 。 也 就 是 说 ,根据 法 
则 12.25，( 卫 + 革 )=1， 而 且 根 据 零 元 法 则 12.15，1 与 任何 馆 辑 表达 式 求 OR 都 等 价 于 1。 























+ 示例 12.27 

考虑 子 句 (a+b+c) 和 (d+a+b+e)。 我 们 可 以 让 5b 扮演 (12.14) 中 p 的 角色 ， 那 么 q 就 是 
d +a+e ， 而 /就 是 a+c 。 请 注意 ， 我 们 已 经 重新 进行 了 一 些 调整 ， 把 子 句 与 (12.14) 匹 配 起 来 。 
首先 , 第 二 个 子 句 与 (12.14) 中 的 第 一 个 子 句 p+g 已 经 匹配 ,而 第 一 个 子 句 是 与 (12.14) 的 第 二 个 
子 句 匹配 的 。 此 外 ,扮演 p 的 角色 的 变量 一 开始 并 未 出 现在 我 们 的 两 个 子 句 中 ,不 过 没关系 ， 
为 OR 的 交换 律 和 结合 律 说 明 我 们 能 够 以 任何 次 序 重新 排列 子 句 。 

如 有 果 我 们 的 两 个 子 句 已 经 出 现在 证 明 中 ， 则 新 子 句 gqg+r 也 可 以 作为 证 明 中 出 现 的 行 ， 这 个 
新 子 句 就 是 (d+at+et+at+c) 。 可 以 消除 多 余 的 a， 将 该 子 句 简 化 为 (d+at+e+c) o 

再 举 个 例子 ,考虑 子 句 (a+b) 和 (a+5)。 如 果 a 是 (12.14) 中 的 p， 而 g 是 5, r 是 5 ， 就 得 出 新 
子 句 (5+4b) 。 该 子 句 等 价 于 1， 因 此 不 需要 生成 。 


12.11.1 ”把 逻辑 表达 式 变 成 合 取 范式 


为 了 让 分 解 起 作用 , 需要 把 所 有 的 前 提 以 及 结论 , 变 成 和 的 积 的 形式 , 也 就 是 “ 合 取 范式 ”。 
可 以 采取 的 方法 有 若干 种 ， 最 简单 的 可 能 就 是 以 下 这 些 。 

(1) 首先 ， 要 消除 除了 AND、OR 和 NOT 之 外 的 任何 运算 符 。 我 们 根据 法 则 12.21 把 E= 五 蔡 
换 为 (EZ 一 FP)(F 一 BE)。 人 然后， 根据 法 则 12.24， 把 G 一 五 替换 为 NOoT(G)+( 丰 。NAND 和 NOR 也 
很 容易 分 别 用 NOT 后 加 上 AND 或 OR 来 替代 。 事 实 上 ， 因 为 AND、OR 和 NoT 是 运算 符 的 完全 集 ， 
所 以 可 知 任何 逻辑 运算 符 ， 包 括 那 些 本 书 中 没有 介绍 的 ， 都 可 以 用 只 涉及 AND 、OR 和 NO 的 

(2) 接 下 来 , 应 用 德 摩根 律 把 所 有 的 和 否定 向 下 压 , 直到 它们 根据 12.8 节 中 的 法 则 12.13 被 其 他 
否定 抵消 ， 或 是 只 应 用 到 命题 变量 上 。 

(3) 现在 要 应 用 OR 对 AND 的 分 配 律 ， 把 所 有 的 OR 压 到 所 有 AND 之 下 。 得 到 是 由 OR 结 合 的 文 
， 然 后 是 由 AND 结 合 的 表达 式 ， 这 就 是 合 取 范 式 表 达 式 。 


+ 示例 12.28 
我 们 来 考虑 以 下 表达 式 




















娄 


p+(q AND NOT(r AND(s -1))) 
注意 ， 为 了 均衡 考虑 简洁 性 和 清晰 性 ， 我 们 在 这 里 和 以 后 的 表达 式 中 会 混用 简化 符号 和 原始 


(1) 步 要 求 把 s 一 1 替换 为 5+t ， 给 出 只 含 AND、OR、NOT 的 表达 式 


中“ 
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p+(g AND NOT(rG +7))) 
在 第 C) 步 中 ， 必 须 利用 德 摩根 律 把 第 一 个 NOT 向 下 压 。 在 接 下 来 的 一 系列 步 又 中 NoT 到 达 了 命 
p+(q(7 +NOT(S +7))) 
p+(g(7 +(NOT $)(7))) 
p+(q(7+(s7))) 
现在 应 用 法 则 12.14， 把 第 一 个 oR 压 到 第 一 个 AND 以 下 。 
(p+9g)(P+(F+G7D))) 
接 下 来 要 利用 12.8 节 的 法 则 12.8 重 新 组 合 命题 变量 , 从 而 把 第 二 和 第 三 个 OR 压 到 第 二 个 AND 
下 





(p+q)((p+7)+(s7)) 
最 后 ， 再 次 利用 法 则 12.14， 所 有 的 oR 都 在 所 有 AND 之 下 。 得 到 的 如 下 表达 式 就 是 合 取 
(p+q)(p+7+sS)(p+7 +1) 


12.11.2 ”利用 分 解 的 推理 


我 们 现在 看 到 了 从 前 提包 、E,、…、E 找到 E 的 证 明 的 一 种 方法 ， 并 了 解 了 其 大 致 脉络 。 把 
E 和 EE 、 忆 五 分 别 转换 为 合 取 范 式 表达 式 F 和 已 忆 、…、。 我 们 要 为 一 对 对 子 句 应 用 分 
解 规 则 ， 因 此 要 为 证 明 添 加 新 子 句 作为 证 明 的 行 。 然 后 ， 如 果 向 证 明 中 添加 了 FF 的 所 有 子 句 ， 
就 证 明了 天 ， 从 而 也 证 明 了。 


+ 示例 12.29 

假设 以 表达 式 坟 一 岂 0 一 殉 人 一 网 作 为 前 提 。 请 注意 ， 该 表达 式 是 示例 12.26 中 使 用 过 
的 前 提 的 AND。 “ 设 像 示 例 12.26 中 那样 ， 所 需 的 结论 是 元。 我 们 可 以 根据 法 则 12.24， 和 替换 掉 这 
些 一 ,把 前 提 和 转换 成 合 取 范式 。 至 此 ,得 到 的 结果 已 经 是 合 取 范式 , 不 需要 进行 进一步 的 处 理 。 
所 需 的 结论 w 已 经 是 合 取 范式 ， 因 为 任何 单个 文字 都 是 子 句 ， 而 单个 子 句 就 是 子 句 的 积 。 因 此 
我 们 一 开始 有 子 句 








(r+u) (Xt+wW) (r+w) 
现在 , 假设 要 以 x 扮演 p 的 角色 ,分 解 第 一 个 和 第 三 个 子 名 ,得 到 的 子 句 就 是 +w。 该 子 句 可 以 
与 前 提 中 的 第 二 个 子 句 一 起 被 分 解 ， 以 u 代 蔡 p， 得 到 子 句 (w) 。 因 为 该 子 句 就 是 所 需 的 子 句 ， 
所 以 任务 就 完成 了 。 图 12-25 把 证 明 过 程 展示 为 一 系列 语句 ， 其 中 每 一 行 都 是 一 条 子 句 。 




















1) (7 十 w) ”前 提 
2) ”( 久 十 促 ) 前提 
3) (7 十 Ww) ”前 提 
4) (ww 十 切 ) (0 和 (3) 的 分 解 
5) (ww) (2) 和 (4) 的 分 解 


图 12-25 “无 的 分 解 证 明 


(D 大 家 现在 应 该 已 经 看 到 ， 不 管 是 写成 很 多 条 前 提 ， 还 是 把 它们 用 AND 连 接 起 来 写 出 一 条 前 提 ， 都 是 可 以 的 。 








分 解 为 何 有 效 


一 般 来 说 , 找到 证 明 需 要 组 织 起 从 前 提 到 结论 这 一 系列 行 的 运气 或 技巧 。 大 家 现在 可 能 
经 注意 到 ， 尽 管 很 容易 验证 12.10 节 和 12.11 节 中 给 出 的 证 明 是 有 效 证 明 ， 而 完成 那些 需要 寻找 
证 明 的 习题 就 要 困难 得 多 。 一 般 来 说 ， 猜 测 示例 12.29 中 那样 为 了 生成 某 一 子 名 或 某 些 子 铭 而 
要 执行 的 一 系列 分 解 ， 并 不 比 寻找 证 明 简单 多 少 。 

不 过 ， 如 果 把 分 解 与 反 证 法 结合 起 来 ， 就 像 在 示例 12.30 中 那样 ， 就 可 以 看 到 分 解 的 魔力 。 
因为 我 们 的 目标 子 句 是 0, 是 “最 小 的 ” 子 句 ， 突 然 间 就 有 了 搜寻 “方向 ”的 概念 。 这 就 是 说 ， 
可 以 试 着 逐步 证 明 更 小 的 子 句 ， 以 期 最 终 能 证 明 0。 当 然 ， 这 样 的 探索 并 不 能 确保 成 功 。 有 时 
候 ， 我 们 在 开始 缩小 子 句 并 最 终 证 明 0 之 前 必须 证 明 某 个 非常 大 的 子 句 。 

其 实 , 分 解 是 针对 命题 演算 的 完全 证 明 过 程 。 只 要 ( 玉 …) 一 是 重 言 式 , 就 可 以 从 以 
字句 形式 表示 的 瑟 、E,、…、El 和 NOT 无 得 出 0。 是 的 ， 这 就 是 逻辑 学 家 们 为 “完全 ”赋予 的 第 
三 个 含义 。 回想 一 下 , 其 他 两 种 含义 分 别 是 “能 够 表示 任何 逻辑 函数 的 运算 符 集 合 ”, 以 及 “NP 
完全 ”中 那样 指 “ 一 类 问题 中 最 难 的 问题 ”。 这 里 还 是 要 说 ， 存 在 这 样 的 证 明 并 不 代表 找到 这 
样 的 证 明 很 容易 。 





12.11.3 ”利用 反 证 法 的 分 解 证 明 

将 分 解 用 作证 明 机 制 的 一 般 方 式 与 示例 12.29 中 的 情况 多 少 有 些 区 别 。 我 们 不 是 从 前 提 开 始 
并 试 着 证 明 绪 论 , 而 是 从 前 提 和 结论 的 否定 开始 , 试 着 得 出 不 含 文字 的 子 句 。 这 一 子 句 的 值 为 0， 
或 者 说 FALSE。 例 如， 如 果 我 们 有 子 句 (p) 和 (万 )， 就 能 以 gqg=r=0 应 用 (12.14)， 得 到 子 句 0。 

这 种 方式 之 所 以 有 效 ， 是 因为 12.9 市 中 提 到 的 法 则 12.19, 或 者 说 (5 一 0)=p 。 在 这 里 , 设 
p 是 要 证 明 的 命题 ， 对 某 些 前 提 EE 、E,、…、E, 和 结论 E 而 言 ， 有 (BB,…E,) 一 5。 那 么 5 就 是 
NOT ((BE,…E) 一 E)， 或 者 利用 法 则 12.24， 就 是 NOT (NOT(EE,…E)+E)。 奋 十 次 应 用 德 摩 
根 律 就 可 以 得 出 p 等 价 于 五 BE,…E,E 。 因 此 ， 要 证 明 p， 可 以 改 为 证 明 万 一 0， 或 者 说 是 证 明 
(ZE,…E,E) 王 0。 也 就 是 说 ,我 们 证 明了 前 提 和 结论 的 否定 一 起 蕴涵 着 矛盾 。 
+ 示例 12.30 

现在 重新 考虑 示例 12.29， 不 过 这 次 要 从 3 个 前 提 子 句 和 所 需 结 论 的 否定 一 一 子 句 (w) 一 一 开 
始 。0 的 分 解 证 明 如 图 12-26 所 示 。 利 用 反 证 法 ， 可 以 得 出 这 些 前 提 药 涵 了 所 需 的 结论 w 。 








1) (7 十 u) ”前 提 

2) (五 十 名 ) ”前 提 

3) (7 十 急 ) ”前 提 

4) (ww) 结论 的 否定 
5) (十 面  〈D 和 (G) 的 分 解 
6) (四 C) 和 (5) 的 分 解 
yt (4) 和 (6) 的 分 解 








图 12-26 利用 反 证 法 的 分 解 证 明 


12.11.4 “习题 
(1) 利用 真 值 表 ， 验 证 表达 式 (12.14) 是 重 言 式 。 
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a 某 人 的 血型 为 A 型 
血型 为 B 型 
血型 为 AB 型 








血型 为 0 型 





血样 进行 测试 7 的 结果 为 阳性 
血样 进行 测试 $ 的 结果 为 阳性 

















图 12-27 “习题 (2) 的 命题 


(2) 设 命题 具有 如 网 12-27 给 定 的 含义 ， 写 出 表示 如 下 概念 的 子 句 或 子 句 之 积 。 
(a) 如 果 测 试 7 结果 为 阳性 ， 那 么 此 人 的 血型 为 A 型 或 AB 型 。 
(b) 如 果 测 试 S 结 果 为 阳性 ， 那 么 此 人 的 血型 为 B 型 或 AB 型 。 
(c) 如 果 某 人 血型 为 A 型 ， 那么 测试 7 的 结果 为 阳性 。 
(d) 如 果 某 人 血型 为 B 型 ， 那 么 测试 $ 的 结果 为 阳性 。 
(e) 如 果 某 人 血型 为 AB 型 , 那么 测试 7 测试 $ 的 结果 都 为 阳性 。 提示: 请 注意 ，(C + st) 不 是 子 句 。 
(有 一 个 人 的 血型 可 能 是 A、B、AB 或 0 其 中 的 一 种 。 
(3) 利用 分 解 ， 找 到 由 习题 (2) 中 可 以 得 出 的 所 有 重要 子 句 。 大 家 应 该 忽略 那些 可 以 简化 为 1 (TRUE ) 
的 无 关 紧 要 的 子 句 ， 还 要 忽略 那些 文字 是 其 他 某 个 子 句 D 文 字 真 超 集 的 子 句 C。 
(4) 为 12.10 节 的 习题 (1) 给 出 使 用 了 分 解 和 反 证 法 的 证 明 。 


12.12 小 结 


在 本 章 中 ， 我 们 已 经 看 到 了 命题 逻辑 的 要 素 ， 包 括 下 列 这 些 : 

口 基本 运算 符 ，AND、oR、NoT、 一 、= 、NAND 和 NOR; 

口 利用 真 值 表 表示 逻辑 表达 式 的 含义 ， 包 括 根据 表达 式 构 造 真 值 表 以 及 根据 真 值 表 构 造 表 
达 式 的 算法 ; 

口 诸多 应 用 到 逻辑 运算 符 的 代数 法 则 中 的 一 部 分 。 

我 们 还 谈论 了 作为 设计 理论 的 逻辑 ， 具 体 如 下 : 

口 卡 详 图 如 何 有 助 于 我 们 为 至 多 含 4 个 变量 的 逻辑 函数 设计 简单 的 表达 式 ; 

口 逻辑 代数 法 则 有 时 候 是 如 何 用 来 简化 逻辑 表达 式 的 。 

然后 ， 我 们 看 到 逻辑 可 以 帮 有 我 们 表示 和 理解 常见 的 证 明 技巧 ， 比 如 : 

口 利用 情况 分 析 进 行 证 明 ; 

口 利用 换 质 位 法 进行 证 明 ; 

口 利用 矛盾 进行 证 明 〈 反 证 法 ); 

口 利用 对 真实 的 归 约 进行 证 明 。 

最 后 ， 我 们 人 研究 了 演绎 法 ， 也 就 是 一 行 行 证 明 语 句 的 构造 ， 注 意 其 中 几 点 : 

口 存在 大 量 推理 规则 ,比如 “肯定 前 件 式 假 言 推理 ”，, 让 我 们 可 以 从 证 明 中 之 前 的 行 构造 新 
一 行 ; 

口 通过 把 证 明 的 行 表示 为 文字 和 ， 并 把 这 些 和 以 实用 的 方式 组 合 ， 分 解 技巧 通常 能 帮助 我 
们 迅速 找到 证 明 ; 

口 不 过 ， 尚 无 已 知 算法 可 以 保证 在 少 于 以 表达 式 大 小 为 指数 的 时 间 内 找到 表达 式 的 
证 明 ; 
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口 此 外 ， 因 为 重 言 式 问题 是 “NP 困难 问题 "， 所 以 不 存在 少 于 指数 时 间 的 解决 该 问题 的 算 
法 这 一 观点 是 非常 可 信 的 。 
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在 本 草 中 我 们 会 看 到 第 12 章 中 学 习 的 命题 逻辑 可 以 应 用 到 数字 电子 电路 的 设计 中 。 这 样 的 
电路 在 每 台 计 算 机 上 都 能 找到 ,它们 使 用 两 种 电压 电 平 (“高 ”和 “ 低 ”) 表示 二 进 制 数值 1 和 0。 
除了 了 解 设计 过 程 之 外 ， 我 们 还 将 看 到 算法 设计 技巧 ， 比 如 “分 治 法 ”， 也 可 以 应 用 到 硬件 上 。 
其 实 , 务必 意识 到 设计 执行 给 定 逻 辑 函 数 的 数字 电路 的 过 程 ， 从 本 质 上 讲 与 设计 执行 给 定 任 务 
的 计算 机 程序 的 过 程 是 非常 类 似 的 。 不 过 二 者 所 使 用 的 数据 模型 却 差 异 明 显 ， 一 般 来 说 电路 会 
被 设计 成 并 行 ( 同时 ) 处 理 很 多 事务 ， 而 一 般 的 编程 语言 都 是 顺序 (一 次 一 步 地 ) 执行 它们 的 
步 又 。 不 过 ， 像 模块 化 设计 这 样 的 通用 程序 设计 技巧 也 是 适用 于 电路 的 。 


13.1 ”本章 主 要 内 容 


本 章 涵 盖 了 数字 电路 设计 中 的 以 下 概念 。 

口 门 的 概念 ， 门 是 执行 某 一 逻辑 运算 的 电子 电路 (13.2 节 )。 

口 门 如 何 被 组 织 成 电路 〈13.3 节 )。 

口 某 些 被 称 为 组 合 电路 的 电路 ， 它 们 是 逻辑 表达 式 的 电子 等 价 物 (13.4 人 )。 

口 电路 设计 所 受 的 物理 约束 ， 以 及 电路 要 快速 产生 答案 所 必须 具备 的 属性 ( 13.5 市 )。 

口 两 个 有 趣 的 电路 示例 : 加 法 器 和 多 路 复 用 需 。13.6 节 和 13.7 节 展示 了 如 何 利 用 分 治 法 为 这 
两 个 问题 设计 执行 迅速 的 电路 。 

口 存储 单元 是 一 种 可 以 记 住 其 输入 的 电路 ， 而 组 合 电路 则 不 能 记 住 它 之 前 接收 的 输入 
(13.8 节 )。 





13.2 门 





门 是 具有 一 个 或 更 多 输入 的 电子 设备 ， 可 以 假设 各 输入 要 么 是 值 0 要 么 是 值 1。 正 如 之 前 提 
过 的 ， 逻 辑 值 0 和 1 通常 使 用 两 个 不 同 的 电压 电 平 表 示 ， 不 过 这 种 物理 表示 方法 并 不 会 对 我 们 产 
生 影响 。 门 通常 具有 一 路 输出 ， 它 是 输入 的 函数 ， 而 且 它 的 值 也 是 0 或 1。 

每 个 门 都 会 计算 某 个 特定 的 布尔 函数 。 大 多 数 电 子 “ 技 术 ”( 制造 电子 电路 的 方法 ) 有 利于 
为 某 些 布尔 也 数 而 不 是 其 他 布尔 函数 构建 门 。 特 别 要 说 的 是 ，ANDi 门 (与 门 ) 和 oOR 门 〈 或 门 ) 
通常 是 很 容易 构建 的 ，NOT 门 ( 非 门 ,也 称 反 相 器 ) 也 是 。 虽 然 像 13.5 节 中 要 讨论 的 ，AND 门 和 
OR 门 可 以 具有 任意 数量 的 输入 ,但 通常 会 对 门 所 具有 的 输入 加 以 实际 的 限制 。 如 果 AND 门 的 所 
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有 输入 都 是 1， 它 的 输出 就 是 1， 而 如 果 它 的 输入 中 至 少 有 一 个 0， 则 其 输出 为 0。 同 样 ， 如 果 OR 
门 的 输入 中 至 少 有 一 个 是 1, 那么 它 的 输出 是 1, 如 果 所 有 输入 都 是 0, 则 其 输出 为 0。 反 相 需 (NOT 
门 ) 只 有 一 路 输入 ， 如 果 它 的 输入 是 0， 那 么 它 的 输出 为 1， 而 如 果 其 输入 为 1， 则 输出 是 0。 

我 们 还 发 现 ， 在 大 多 数 技术 中 NAND 门 〈 与 非 门 ) 和 NOR 门 〈 或 非 门 ) 也 是 很 容易 实现 的 。 
只 有 NAND 门 的 所 有 输入 都 是 1 才 产 生 输出 0， 和 否则 输出 就 是 1。 当 NoR 门 的 所 有 输入 为 0 时 ， 其 输 
入 是 1， 否 则 它 的 输入 是 0。 比 较 难 以 通过 电子 方式 实现 的 逻辑 函数 是 等 价 ， 该 函数 接受 两 路 输 
入 x 和 y， 而 且 如 果 x 和 y 都 是 1 或 都 是 09， 那么 产生 的 输出 就 是 1。 而 当 x 和 y 中 刚好 有 一 个 是 1 时 ， 
输出 就 是 0。 不 过 , 我 们 可 以 通过 实现 能 够 识别 逻辑 函数 xy+xy 的 电路 , 用 AND 门 、OR 门 和 NOT 
门 构建 等 价 电路 。 

表示 我 们 提 到 的 门 的 符号 如 图 13-1 所 示 。 除 了 反 相 磊 ( NOT 门 ) 之 外 ， 所 示 的 每 种 门 都 具 
有 两 路 输入 。 不 过 ， 通 过 添加 额外 的 线 ， 很 容易 给 出 两 个 以 上 的 输入 。 单 输入 的 AND 门 和 OR 门 
也 是 可 行 的 , 但 它们 没有 什么 实际 作用 ， 只 是 把 它 的 输出 传递 给 输出 。 单 输入 的 NAND 门 和 NOR 
门 其 实 就 是 反 相 骨 。 


1 2 


(a) AND (b) OR (¢) NOT 














i ~ 
1 ”> 
(d) NAND (e) NOR 


图 13-1 表示 门 的 符号 


13.3 电路 


通过 连接 某 些 门 的 输出 与 其 他 门 的 输入 ， 就 可 以 把 门 组 合成 电路 。 整 个 电路 可 能 有 一 个 或 
更 多 输入 ， 每 路 输入 都 可 能 是 电路 中 硅 干 个 门 的 输入 。 而 一 个 或 多 个 门 的 输出 会 被 指定 为 电路 
的 和 输出。 如果 存在 多 路 输出， 那么 还 必须 为 输出 的 门 指定 次 序 。 


+ 示例 13.1 

图 13-2 展 示 了 产生 输入 x 和 y 的 等 价 函 数 作 为 输出 z 的 电路 。 约定 而 言 , 我 们 把 输入 放 在 顶部 。 
输入 x 和 y 都 是 提供 给 门 4 的 ， 它 是 个 AND 门 ， 所 以 当 (是 仅 当 ) x=y=1 时 会 产生 输出 1。 此 外 ， 
x 和 和 y 会 分 别 被 NoT 门 反 相 ， 而 且 这 些 反 相 器 的 输出 会 被 提供 给 AND1 站 D。 因 此 ， 当 且 仪 当 x 和 y 都 
是 0 时 , 门 DD 的 输出 是 1。 因 为 门 4 和 门 DD 的 输出 会 提供 给 oRI]E, 我 们 可 以 看 到 当 且 仪 当 x= y=1 
或 x=y= 0 时 门 E 的 输出 是 1。 图 13-3 中 的 表 给 出 了 对 应 各 门 输出 的 逻辑 表达 式 。 

因此 ， 当 且 仅 当 逻 辑 表达 式 xy + x 的 值 为 1 时 , 该 电路 的 输出 z ( 就 是 门 E 的 输出 ) 是 1。 因 
为 该 表达 式 等 价 于 表达 式 x=y ,我 们 看 到 电路 的 输出 是 这 两 路 输入 的 等 价 函 数 。 

















13.3 ”电路 5365 








之 


图 13-2 ”等 价 电路 : z 是 表达 式 x=y 


门 的 输出 





图 13-3 ”图 13-2 中 各 门 的 输出 


13.3.1 组合 电路 和 时 序 电 路 


我 们 可 以 利用 AND 、OR 和 NoT 这 样 的 一 系列 逻辑 运算 符 写 出 表达 式 ， 而 这 类 表达 式 与 可 以 
用 执行 同一 组 运算 符 的 门 构建 的 电路 之 间 存 在 着 密切 关系 。 在 继续 讲述 之 前 ， 我 们 先 把 注意 力 
集中 在 一 类 称 为 组 合 电路 ( combinational circuit ) 的 重要 电路 上 。 这 些 电路 是 无 环 的 ,这 种 情况 
下 门 的 输出 不 能 到 达 其 输入 ， 即 便 是 经 过 一 系列 中 间 门 。 

我 们 可 以 利用 图 的 知识 来 精确 定义 想 通 过 组 合 电路 表示 的 含义 。 首 先 ， 画 出 图 中 节点 对 应 
电路 中 的 门 的 有 癌 图 。 如 果 门 u 的 输出 直接 连接 到 门 y 的 任何 输入 ， 就 添加 一 条 弧 u 一 v 。 如 果 
电路 的 图 中 没有 环 路 ， 那 么 该 电路 就 是 组 合 电路 ， 否 则 它 就 是 时 序 电路 。 
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+ 示例 13.2 

在 图 13-4 中 ,我 们 看 到 根据 图 13-2 所 示 电 路 画 出 的 有 向 图 。 例 如 , 存在 狐 4 一 5 ， 因 为 门 4 
的 输出 被 连接 到 门 E 的 输入 。 图 13-4 所 示 的 图 显然 不 含 环 路 ， 其 实 ， 它 是 以 E 为 根 节点 ,方向 倒 
置 的 树 。 因 此 ， 可 以 得 出 结论 : 图 13-2 所 示 的 电路 是 组 合 电路 。 


图 13-4 ”根据 图 13-2 中 的 电路 构建 的 有 向 图 


男 一 方面 ， 考 虑 图 13-5a 的 电路 。 在 那 幅 图 中 ， 门 4 的 输出 是 门 3 的 输入 ， 而 门 3 的 输出 又 是 
门 4 的 输入 。 对 应 该 电路 的 图 如 图 13-5b 所 示 ， 它 显然 具有 环 路 ， 所 以 该 电路 是 时 序 电 路 。 
2 y 


CS 


(a 电路 


(b) 它 的 


图 13-5 时序 电路 及 其 对 应 的 图 


假设 该 电路 的 输入 x 和 y 都 是 1， 那么 B 的 输出 就 肯定 是 1， 这样 AND 门 4 的 两 路 输入 都 是 1。 

此 ， 该 门 会 产生 输出 1。 现 在 我 们 可 以 设 输 入 "是 0， 而 oR 门 8 的 输出 仍然 是 1， 因 为 它 的 另 一 路 

输入 (来 自 4 的 输出 的 那 路 输入 ) 是 1。 因 此 ，4 的 输入 仍然 都 是 1， 而 它 的 输出 也 还 是 1。 
不 过 , 假设 * 变 为 0， 而 不 管 y 是 不 是 0。 那 么 门 4 的 输出 以 及 电路 的 输出 一 定 是 9。 如 果 在 过 
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去 的 某 个 时 刻 ，x 和 ) 都 是 1， 而 且 因 此 x (但 y 不 一 定 ) 仍然 是 1， 就 可 以 把 电路 输出 z 描 述 为 1。 
图 13-6 把 知 干 输入 值 组 合 对 应 的 输出 表示 成 了 时 间 的 函数 ， 低 电 平 表示 0， 高 电 平 表示 1。 


SEE et 











| [| I 


a 


图 13-6 ”图 13-5a 所 示 电 路 的 输出 ， 表 示 为 时 间 的 函数 





时 序 电路 和 自动 机 


在 第 10 章 讨论 过 的 确定 有 限 自动 机 与 时 序 电 路 之 间 存 在 密切 关系 。 尽管 该 主题 不 在 本 书 要 
讨论 的 范围 之 内 ,但 给 定 任何 确定 自动 机 ,我 们 都 可 以 设计 这 样 一 个 时 序 电路 。 只 有 当 自 动机 
的 输入 序列 被 接受 时 ， 该 电路 才 输 出 1。 更 精确 地 讲 ， 可 能 来 自任 意 字 符 集合 的 自动 机 输入 ， 
一 定 要 经 过 合适 数量 的 逻辑 输入 进行 编码 ， 电 路 的 k 个 逻辑 输入 最 多 可 以 编码 2" 个 字符 。 





我 们 将 会 在 本 章 结 尾部 分 简要 讨论 一 下 时 序 电 路 。 正 如 我 们 在 示例 13.2 中 看 到 的 ， 时 序 电 
路 具备 一 种 能 力 ， 可 以 记 住 与 目前 为 止 所 见 输入 序列 有 关 的 重要 事项 ， 因 此 像 主 存 和 寄存 天 这 
样 的 计算 机 关键 元 件 需要 它们 。 另 一 方面 ， 组 合 电路 可 以 计算 逻辑 国 数 的 值 ， 但 它们 必须 处 理 
输入 的 单个 设置 ， 而 且 没 法 记 住 之 前 的 输入 被 置 为 什么 。 不 过 ， 组 合 电路 也 是 计算 机 的 关键 元 
件 。 组 合 电路 为 许多 任务 所 需要 ， 比 如 把 数字 相 加 ， 把 指令 解码 成 使 计算 机 可 以 执行 这 些 指令 
的 电子 信号 等 。 在 接 下 来 的 几 节 中 ， 我 们 将 把 大 多 数 精力 放 在 组 合 电路 的 设计 上 。 


13.3.2 “习题 


(1) 设计 产生 以 下 输出 的 电路 ， 可 以 利用 如 图 13-1 所 示 的 任何 门 。 
(a) 输入 x 和 y 的 奇偶 校 验 (或 者 说 和 mod2 ) 函数 ， 当 且 仅 当 x* 和 ?中 刚好 有 一 个 是 1 时 输出 为 1。 
(b) 输入 w、x、y 和 z 的 多 数 ( majority ) 因数 ， 当 且 仅 当 输 入 中 有 3 个 或 3 个 以 上 为 1 时 输出 是 1。 
(c) 输入 w、x、y 和 和 z 的 函数 ， 只 有 在 输入 全 是 1 或 全 不 是 1 的 情况 下 输出 是 1。 
(d) 12.4 方 习题 (7) 中 讨论 过 的 异 或 函数 @@ 。 

(2) * 假设 图 13-5a 的 电路 被 修改 为 门 4 和 门 3 都 是 AND 门 ， 而 且 输 入 x 和 y 一 开始 都 是 1。 随 着 输入 改变 ， 
在 什么 情况 下 输出 会 是 1? 

(3)* 如 果 两 个 门 都 是 oOR 门 ， 重 复习 题 (2)。 


13.4 ”逻辑 表达 式 和 电路 


要 构建 输出 ( 表示 为 其 输入 的 函数 ) 与 给 定 逻 辑 表达 式 输出 相同 的 电路 是 相当 简单 的 。 反 
过 来 ， 给 定 组 合 电路 ， 我 们 也 可 以 为 电路 的 各 路 输出 〈 表示 为 其 输入 的 函数 ) 找到 相应 的 逻辑 
表达 式 。 而 正如 我 们 在 示例 13.2 中 看 到 的 ， 同 样 的 做 法 并 不 适用 于 时 序 电路 。 
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13.4.1 从 表达 式 到 电路 

给 定 具 有 某 些 逻辑 运算 符 的 逻辑 表达 式 ， 我 们 可 以 根据 它 构建 一 个 组 合 电路 ， 该 电路 使 用 
具有 相同 运算 符 的 门 ， 而 且 可 以 识别 相同 的 布尔 函数 。 我 们 构造 的 电路 总 是 具有 树 的 形式 ， 所 
以 可 以 通过 对 表达 式 的 表达 式 树 进行 结构 归纳 以 构造 电路 。 

依据 。 如 果 表 达 式 树 是 单个 节点 , 该 表达 式 只 能 是 一 路 输入 ， 比 方 说 x。 而 该 表达 式 对 应 的 
“电路 ”就 会 是 电路 输入 x 本 身 。 











图 13-7 ”对 应 表达 式 9(B,E,,…,E,) 的 表达 式 树 


归纳 。 而 对 归纳 部 分 ， 假设 所 考虑 的 表达 式 树 像 图 13-7 这 样 。 在 根 市 点 位 置 存 在 某 个 被 称 
为 9 的 逻辑 运算 符 , 例如 9 可 以 是 AND 或 OR。 根 节点 有 nn 棵 子 树 ， 而 且 要 对 各 子 树 的 结果 应 用 运 
算 符 0 以 产生 整 棵 树 的 结果 。 

因为 我 们 在 进行 结构 归纳 ， 所 以 可 以 假定 归纳 假设 适用 于 子 表达 式 。 因 此 ， 存 在 对 应 表达 
式 玉 的 电路 CG、 对 应 ,的 电路 C, ， 等 等 。 

要 为 E 构 建 电 路 ， 就 要 为 运算 符 9 选 择 一 个 门 ， 并 为 该 门 提供 n 路 输入 ， 其 中 各 路 输入 按照 
次 序 分 别 是 电路 CGC 、C,、…、C, 的 输出 。 而 对 应 E 的 电路 的 输出 来 自 刚 介绍 的 6 门 , 电路 构造 如 
图 13-8 所 示 。 








电路 输入 





电路 输出 


图 13-8 ”表示 2( 忆 ,已 ) 的 电路 ， 其 中 C, 是 表示 ,的 电路 
我 们 所 构建 的 电路 是 以 显 见 的 方式 计算 表达 式 的 。 不 过 ， 也 可 能 存在 产生 相同 输出 函数 但 
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所 使 用 的 门 更 少 或 电路 层级 更 少 的 电路 。 例 如 ， 如 果 给 定 的 表达 式 是 (x+y)z+(x+y)Ww， 那么 
我 们 构建 的 电路 就 会 出 现 两 个 识别 相同 表达 式 x+y 的 子 电路 。 我 们 可 以 重新 设计 该 电路 ， 从 而 
只 使 用 一 个 这 样 的 子 电路 ， 并 为 用 到 子 表达 式 x+y 的 其 他 地 方 提供 该 子 电路 的 输出 。 

要 改进 电路 设计 ， 还 可 以 进行 其 他 更 为 狗 狂 的 变形 。 就 像 高 效 算 法 的 设计 一 样 ， 电 路 设计 
也 是 门 艺术 ， 而 且 我 们 还 将 在 本 章 后 续 的 内 容 中 看 到 一 些 和 电路 设计 有 关 的 重要 技巧 。 


13.4.2 ”从 电路 到 逻辑 表达 式 


现在 来 考虑 一 下 相反 方向 的 问题 ， 为 组 合 电 路 的 输出 构造 逻辑 表达 式 。 因 为 我 们 知道 组 合 
电路 的 图 是 无 环 的 ， 所 以 可 以 选 定 其 节点 〈《 即 电路 中 的 门 ) 的 拓扑 次 序 ， 而 且 具 有 如 下 属性 : 
如 有 果 该 次 序 中 第 ;个 门 的 输出 被 提供 给 第 ;个 门 的 输入 ， 那 么 ;一定 小 于 j。 


+ 示例 13.3 

图 13-2 所 示 电 路 中 的 门 可 能 的 拓扑 次 序 之 一 是 4BCDE， 而 男 一 拓扑 次 序 是 BCDA4E。 不 过 
ABDCE 不 是 拓扑 次 序 ， 因 为 门 C 要 为 门 D 提 供 输入 ， 但 该 序列 中 D 却 出 现在 C 之 前 。 

要 从 电路 构建 表达 式 ， 就 要 使 用 归纳 构造 。 这 里 将 通过 对 ;的 归纳 证 明 如 下 命题 。 

命题 S(i) 。 对 拓扑 次 序 中 的 前 i 个 门 来 说 ， 存 在 与 这 些 门 的 输出 对 应 的 逻辑 表达 式 。 

依据 。 依 据 是 i=0 。 因 为 要 考虑 的 是 0 个 门 ， 就 没什么 要 证 明 的 ， 所 以 依据 部 分 是 成 立 的 。 

归纳 。 而 对 于 归纳 部 分 , 要 看 看 拓扑 次 序 中 的 第 i 个 门 。 假设 门 的 输入 是 、、…、。 如 
果 了 7 是 电路 的 输入 x, 那么 令 对 应 输入 了 的 表达 式 ,是 x。 如 果 了 是 其 他 某 个 门 的 输出 , 那么 该 
门 在 该 拓扑 次 序 中 一 定 先 于 第 i 个 门 , 这 表示 我 们 已 经 为 该 门 的 输出 构建 了 某 个 表达 式 ,。 设 与 
门 i 相 关联 的 运算 符 为 8， 那么 对 应 门 的 表达 式 就 是 0(E,E,,…,E,)。 在 0 是 约定 使 用 中 级 表示 
法 的 二 元 运算 符 的 一 般 情况 下 , 门 的 表达 式 就 可 以 写 为 (5 )6(E,)。 虽然 根据 运算 符 的 优先 级 这 
两 个 括号 也 有 可 能 是 不 必要 的 ， 但 为 了 安全 起 见 还 是 用 了 括号 。 


+ 示例 13.4 

现在 要 利用 门 的 拓扑 次 序 4BCDE 为 图 13-2 所 示 的 电路 确定 输出 表达 式 。 首 先 ， 我 们 要 看 看 
AND 门 4， 它 的 两 路 输入 来 自 电 路 的 输入 x 和 7y， 所 以 与 4 的 输出 对 应 的 表达 式 就 是 zy。 

门 B 是 输入 x 的 反 相 器 ， 所 以 它 的 输出 是 xX。 同样 ， 门 C 的 输出 是 了 了 。 现 在 可 以 处 理 ANDI]D 
了 ,， 它 的 输入 是 和 C 的 输出 。 因 此 ， 对 应 门 D 输 出 的 表达 式 为 zy7 。 最 后 ， 门 E 是 oR 门 ， 它 的 输 
和 人 是 4 和 刀 的 输出 。 因 此 要 把 这 两 个 门 的 输出 用 OR 运 算 符 连接 起 来 ， 从 而 得 到 表达 式 xy + 了， 
作为 对 应 门 E 输 出 的 表达 式 。 因 为 E 是 电路 唯一 的 输出 门 ， 所 以 该 表达 式 也 是 电路 的 输出 。 回 想 
一 下 ， 图 13-2 所 示 的 电路 整数 是 用 来 识别 布尔 另 数 xsy 的 。 很 容易 验证 我 们 为 门卫 得 出 的 这 个 
表达 式 与 x=y 是 等 价 的 。 


+ 示例 13.5 

在 之 前 的 例子 中 ,我们 的 电路 都 只 有 一 路 输出 ， 而 且 电 路 本 身 就 构成 了 一 棵 树 。 但 这 些 条 
件 一 般 而 言 是 不 成 立 的 。 我 们 现在 要 介绍 一 个 设计 多 输出 电路 的 例子 ， 而 且 其 中 一 些 门 的 输出 
会 用 作 若 干 个 门 的 输入 。 回想 一 下 , 第 1 章 中 讨论 过 用 一 位 加 法 器 构建 一 个 计算 二 进 制 数 字 加 法 
的 电路 。 一 位 加 法 融 电 路 有 表示 要 相 加 的 两 个 数字 中 某 一 特定 位 的 两 路 输入 x 和 7。 除 此 之 外 ， 
它 还 有 第 三 路 输入 c， 表示 从 其 右 侧 相 邻 位 置 ( 低 一 位 的 位 置 ) 到 该 位 的 进位 输入 。 而 一 位 加 法 
器 会 生成 以 下 两 位 作为 输出 。 
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(1) 和 值 位 z， 当 x、y 和 c 中 有 奇数 个 是 1 时 它 的 值 为 1。 
(2) 进位 输出 位 4， 当 x、y 和 c 中 有 两 个 或 三 个 是 1 时 它 的 值 为 1。 
在 图 13-9 中 , 我们 看 到 了 对 应 一 位 加 法 器 和 值 函数 z 与 进位 输出 函数 d 的 卡 诺 图 。 在 8 个 可 能 
的 最 小 项 中 ， 其 中 有 7 个 出 现在 对 应 z 或 4 的 函数 中 ， 而 只 有 一 个 xyc 是 同时 出 现在 两 者 之 中 。 
yC yC 





















00 01 11 10 00 01 11 10 
化 
0 1 0 1 0 
器 " 口 
(a) 和 z (b) 进位 输出 4 


图 13-9 对 应 和 值 函 数 和 进位 输出 函数 的 卡 诺 图 
图 13-10 展 示 了 为 一 位 加 法 需 系 统 设计 过 的 电路 。 首 先 要 利用 项 部 的 3 个 反 相 天 为 电路 的 输 
入 反 相 。 然 后 为 输出 中 所 需 的 各 个 最 小 项 构建 AND 门 。 这 些 门 编号 为 1 到 7， 而 且 这 些 整数 表明 
了 它 的 输入 中 按 次 序 有 哪些 是 “为 真 ”的 电路 输入 、y、c， 以 及 有 哪些 是 “互补 的 ”输入 ,， 式 、 
7、5 。 也 就 是 说 ， 把 这 个 整数 写成 3 位 的 二 进 制 数字 ， 并 用 这 几 位 按 次 序 表示 x、y 和 c。 例 如 ， 
门 4， 或 者 说 是 400). ， 其 输入 x 为 真 ， 而 输入 y 和 c 是 互补 的 ， 也 就 是 说 ， 它 产生 的 输出 表达 式 
是 xyc 。 请 注意 ， 这 里 是 没有 门 0 的 ， 因 为 每 路 输出 都 不 需要 最 小 项 ZXy7c 。 





















































图 13-10 ”一 位 加 法 器 电路 
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最 后 ， 电 路 的 输出 z 和 4 是 由 底部 的 OR 门 组 合 的 。 对 应 z 的 OR 门 的 输入 来 自 最 小 项 中 z 为 真 的 
各 个 AND 门 的 输出 ， 而 对 应 4 的 oR 门 的 输入 也 是 用 类 似 方 式 选 择 的 。 
现在 来 为 图 13-10 所 示 的 电路 求 输出 表达 式 。 我 们 所 使 用 的 拓扑 次 序 是 反 相 带 在 前 ,接着 是 
AND1 站 1、2、…、7， 以 及 最 后 的 对 应 z 和 4 的 OR 门 。 首 和 完 ， 这 3 个 反 相 右 的 输出 表达 式 显然 是 x 、 
7 和 5 。 然 后 ,我 们 已 经 提 过 如 何 为 这 些 AND 门 选择 输入 ， 以 及 各 门 输出 对 应 的 表达 式 与 门 编 
号 的 二 进 制 表示 之 间 是 如 何 相 关联 的 。 因 此 ， 门 1 的 输出 表达 式 就 是 xXyc 。 最 后 ，ORI ]z 的 输出 
是 对 门 1、2、4、7 的 输出 表达 式 求 OoR， 也 就 是 
XyC+ XYyC 十 2 C + Xyc 
同样 ， 对 应 4 的 OR 门 的 输出 是 对 门 3、5、6、7 的 输出 表达 式 求 OR， 即 
XyC + XyC + XxXyc + xyc 
这 里 留 一 道 习 题 给 大 家 ， 证明 该 表达 式 与 如 下 表达 式 是 等 价 的 。 
yet+xc+Xxy 


提示 一 下 ， 如 果 我 们 从 对 应 gq 的 卡 诺 图 着 手 ， 就 能 得 到 该 表达 式 。 

















电路 图 的 约定 


如 果 电 路 像 图 13-10 中 所 示 的 那样 复杂 时 ， 就 要 拿 出 一 项 实用 的 约定 来 简化 绘图 。 我 们 经 
常 需要 让 “电线 ”( 输出 和 输入 之 间 的 线 ) 交叉 ， 又 不 表示 这 些 交 叉 的 线 是 同一 条 线 。 因 此 ， 
电路 的 标准 约定 是 这 样 的 : 除非 在 线路 相交 的 位 置 画 上 一 个 点 ， 否 则 相交 的 线路 不 是 连通 的 。 
例如 ， 虽 然 从 电路 和 输入) 出 发 的 重 直 线 与 标号 x 或 元 的 水 平 线 有 交叉 ， 但 它们 是 不 连通 的 。 它 与 
标号 为 ?的 水 平 线 是 连通 的 ， 因 为 在 相交 的 位 置 画 上 了 点 。 





13.4.3 “习题 


(1) 为 以 下 布尔 函数 设计 电路 。 如果 可 以 把 由 相同 运算 符 连接 的 3 个 或 更 多 操作 数组 合 在 一 起 , 就 不 需 
要 限制 自己 只 使 用 2 路 输入 的 门 。 
(a) x+y+z。 提 示 : 将 该 表达 式 视 为 OR ( x,y,z ) 。 
(b) xy+Xz+ yz 。 
(Cc) x+(7X)(O7 十 2) 。 
(2) 为 图 13-11 中 的 各 电路 计算 对 应 各 个 门 的 逻辑 表达 式 。 电 路 输出 的 逻辑 表达 式 又 是 什么 ? 为 电路 (b) 
构造 只 使 用 AND 、OR 和 NoT 门 的 等 价 电路 。 
(3) 证 明示 例 13.4 和 13.5 中 用 到 过 的 以 下 重 言 式 。 
(a) (xy+xy)=(x=y) 
(b) (xyc+xyct+xyc +xyc)=(yc+xct+xy) 








芯片 
芯片 通常 含有 若干 结合 起 来 可 用 于 构建 门 的 材料 “ 层 ”。 线 路 可 以 在 任何 一 层 布 设 ， 把 门 相互 连接 
起 来 ， 不 同 层 上 的 线路 通常 可 以 交叉 而 不 互相 影响 。 在 1994 年 ， 芯 片 的 “特征 尺寸 ” ( 大 体 上 就 是 电线 
的 最 小 宽度 ) 通常 小 于 二 分 之 一 微米 ( 1 微米 是 0.001 毫 米 ， 或 者 说 大 约 0.00004 英 寸 ) 。 门 可 以 构建 在 这 
若干 微米 见方 的 区 域 中 。® 





OD 当今 的 芯片 制造 工艺 已 经 达到 纳米 级 的 水 平 。 一 一 译 者 注 
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制造 芯片 的 过 程 是 很 复杂 的 。 例如， 有 一 步 是 把 薄 薄 一 层 光 致 抗 蚀 剂 (photoresist ) 沉积 在 整个 芯片 
上 。 然 后 要 用 到 茶 层 上 所 需 功 能 的 底片 。 通 常用 光 或 是 电子 束 照 射 底片 ， 被 电子 束 直 接 照射 到 的 那 层 会 
被 蚀刻 掉 ， 只 留 下 所 需 的 电路 。 





图 13-11 习题 (2) 的 电路 


13.5 ”电路 的 一 些 物理 限制 


现在 ， 很 多 电路 都 是 以 “芯片 ”或 者 说 集成 电路 的 形式 构建 的 。 大 量 的 门 ， 可 能 有 多 达 数 
百 万 的 门 ， 以 及 连接 这 些 门 的 线路 ， 被 构建 在 一 块 一 厘米 见方 的 半导体 和 金属 材料 上 。 构 建 集 
成 电路 的 各 种 “技术 ”或 者 说 方法 都 为 设计 高 效 电路 之 路 施加 了 不 少 约束 。 例 如 ， 正 如 我 们 之 
前 提 到 的 ， 某 些 类 型 的 门 ， 比 如 AND、OR 和 NoT ， 就 要 比 其 他 类 型 的 门 更 容易 构建 。 


13.5.1 电路 速度 


对 每 个 门 而 言 ， 在 接收 到 输入 的 时 间 和 发 送出 输出 的 时 间 之 间 都 存在 延迟 。 这 一 延迟 可 能 
只 有 几 纳 秒 ( 1 纳 秒 是 10” 秒 )， 不 过 在 复杂 的 电路 ， 比 如 在 计算 机 的 中 央 处 理 器 中 ， 即 便 是 在 
执行 简单 指令 时 , 信息 也 会 在 很 多 层 门 之 间 传 送 。 由 于 现代 计算 机 能 在 远 小 于 1 微 秒 ( 即 10“ 秒 
的 时 间 内 执行 指令 ， 因 此 值 在 传递 过 程 中 必 经 之 门 的 数量 显然 必须 控制 到 最 低 限 度 。 

因此 ， 对 组 合 电路 而 言 ， 任 何 从 输入 到 输出 的 路 径 上 安放 门 的 最 大 数量 都 是 一 种 衡量 性 能 
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的 标准 ， 就 类 似 于 程序 的 运行 时 间 那 样 。 也 就 是 说 ， 如 果 我 们 希望 电路 能 迅速 计算 输出 ， 就 必 
须 把 表示 电路 的 图 中 最 长 路 径 的 长 度 减 少 到 最 小 。 电 路 的 延迟 是 最 长 路 径 上 门 的 数量 ， 也 就 是 
说 , 该 最 长 路 径 的 长 度 加 1 就 是 延迟 。 例 如 ， 图 13-10 所 示 的 加 法 器 延迟 是 3， 因 为 从 输入 到 输出 
的 最 长 路 径 经 过 了 一 个 反 相 器 ， 然 后 是 一 个 AND 门 ， 最 后 经 过 了 一 个 OR 门 ， 这 样 的 路 径 在 该 电 
路 中 有 很 多 条 。 

请 注意 ， 和 运行 时 间 一 样 ， 电 路 延迟 也 只 是 一 种 “数量 级 ”的 量 。 不 同 的 技术 会 让 接受 某 
个 门 的 输入 以 产生 该 门 输出 的 过 程 花费 不 同 的 时 间 。 因 此 ， 如 果 有 两 个 延迟 分 别 为 10 和 20 的 电 
路 ,那么 可 知 ， 如 果 它 们 是 用 相同 技术 实现 ， 而 且 其 他 因素 也 都 相同 ， 那 么 第 一 个 电路 所 花 的 
时 间 就 是 第 二 个 电路 的 一 半 。 不 过 ， 如 果 用 更 快 的 技术 实现 第 二 个 电路 ， 那 么 它 有 可 能 战胜 用 
原 技术 实现 的 第 一 个 电路 。 


13.5.2 ”大 小 限制 


构建 电路 的 开销 大 致 上 是 与 电路 中 门 的 数量 成 正比 的 ， 因 此 我 们 很 乐意 减少 门 的 数量 。 此 
外 ， 电 路 的 大 小 也 会 影响 到 它 的 速度 ， 而 且 小 型 电路 往往 运行 得 更 快 。 一 般 来 说 ， 电 路 所 具有 
的 门 越 多 ， 世 片上 被 占据 掉 的 面积 就 越 大 。 使 用 较 大 面积 至 少 有 如 下 两 项 负面 影响 。 

(1) 如 果 面 积 较 大 ， 就 需要 较 长 的 线路 来 连接 相隔 较 远 的 门 。 线 路 越 长 ， 信 号 从 线路 一 端 传 
导 到 另 一 端 所 需 的 时 间 就 越 长 。 这 种 传播 延迟 (propagation delay ) 是 电路 中 除了 门 “计算 ”和 输 
出 所 花 时 间 之 外 的 另 一 个 延迟 来 源 。 

(2) 芯片 的 大 小 也 是 有 限制 的 ， 因 为 芯片 越 大 ， 就 越 有 可 能 存在 导致 芯片 不 合格 的 瑕 疫 。 如 
果 把 电路 分 散在 香干 芯片 中 ,那么 连接 这 些 忆 片 的 线路 会 傍 来 严重 的 传播 延 到 。 

结论 就 是 ， 把 电路 中 门 的 数量 控制 在 较 低 水 平 会 带 来 明显 的 好 处 。 


13.5.3 ” 扇 入 和 扇 出 限制 


电路 设计 中 的 第 三 个 限制 源 自 物 理 现 实 。 如 果 门 具有 过 多 输入 ， 或 者 门 的 输出 连接 到 过 多 
的 输入 ， 就 会 为 此 付出 代价 。 门 的 输入 数 被 称 为 扇 入 〈fan-in )， 而 门 的 输出 所 连接 到 的 输入 的 
数量 就 叫 作 遍 出 (fan-out )。 尽 管 原则 上 讲 遍 和 或 矶 出 是 存在 限制 的 , 但 实际 应 用 中 ， 具有 较 大 
忆 入 和 (或 ) 鹿 出 的 门 要 比 那些 扇 人 和 扇 出 较 小 的 门 更 慢 。 因 此 ， 我 们 要 试 着 在 设计 电路 时 对 
户 入 和 局 出 加 以 限制 。 


+ 示例 13.6 

假设 某 计 算 的 寄存 需 是 32 位 的 ， 而 且 我 们 想 用 电路 实现 COMPARE 机 器 指令 。 必 须 构 建 的 内 
容 之 一 是 测试 寄存 器 是 否 全 为 0 的 电路 。 这 一 测试 使 用 具有 32 路 输入 的 oOR 门 实现 ， 每 路 输入 对 
应 寄存 器 的 一 位 。 输 入 为 1 就 表示 该 寄存 器 存放 的 并 不 是 0， 而 输出 0 就 意味 着 它 存放 的 是 0。 "如 
果 要 用 1 来 表示 问题 “寄存 琵 是 否 存 放 着 0” 的 肯定 回答 ,那么 就 要 用 反 相 秦 或 者 NOR 门 来 为 输 
出 求 补 。 

不 过 ,， 朵 和 人 达到 32 一 般 来 说 远 高 于 我 们 想 要 的 值 。 假 设 要 限制 自己 只 使 用 忆 入 为 2 的 门 。 这 
个 限制 可 能 太 低 了 ,不 过 这 里 只 是 为 了 举例 说 明 问 题 。 首 先 要 问 ， 如 果 需 要 计算 n 路 输入 的 OR， 
那么 需要 多 少 个 两 输入 的 OR 门 ” 显 然 ， 每 个 两 输入 的 门 都 会 把 两 个 值 结合 成 一 个 值 ( 它 的 输 



































QD 严格 地 讲 ， 这 一 结论 只 有 在 2 的 补 码 表 示 中 才 成 立 。 在 一 些 其 他 的 表示 法 中 ， 存 在 两 种 表示 0 的 方法 。 例 如 ， 如 
果 用 符号 幅度 来 表示 ， 就 只 需 要 测试 后 31 位 是 否 为 0。 
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出 )， 因 此 会 把 我 们 计算 z 路 输入 的 OR 所 需 的 输入 数 减 1。 在 使 用 了 7 -1 个 门 之 后 ， 我 们 会 得 到 
一 个 值 ， 如 果 电 路 设计 得 当 的 话 ， 这 个 值 就 是 所 有 7 个 原来 的 值 的 OQR。 因 此 ， 至 少 需要 31 个 门 
来 计算 向、 天、 2 这 32 位 的 ORs 

图 13-12 展 示 了 实现 这 种 OR 的 一 种 简单 做 法 。 在 这 种 方法 中 , 我 们 用 左 结合 的 方式 为 这 些 位 
分 组 。 各 个 门 的 输出 会 提供 给 下 一 个 门 作为 输入 ,该 电路 的 图 中 有 一 条 含 31 个 门 的 路 径 ， 因 此 
该 电路 的 延迟 是 31。 











Xl1 Lo 3 化 4 32 


图 13-12 ”为 32 位 取 oR 的 缓慢 方式 


图 13-13 展 示 了 一 种 更 好 的 方式 。 具 有 5 层 的 完全 二 叉 树 使 用 了 同样 的 31 个 门 ， 不 过 延迟 只 
有 5。 因 此 可 以 预期 图 13-13 所 示 电 路 的 运行 速度 是 图 13-12 所 示 电 路 的 6 倍 。 其 他 影响 速度 的 因 
素 可 能 让 这 个 倍数 比 6 小 , 但 是 即便 是 对 32 位 这 样 “ 小 ”的 位 数 来 说 ,这 种 聪明 设计 也 明显 要 比 
之 前 的 简单 设计 来 得 快 。 

如 果 不 能 马上 “看 出 ”使 用 完全 二 又 树 作 为 电路 的 技巧 ， 也 可 以 利用 分 治 范 例 得 出 图 13-13 
所 示 的 电路 。 也 就 是 说 ， 要 取 2 位 的 OR， 可 以 把 这 些 位 等 分 成 各 含 2™ 位 的 两 组 。 这 两 组 所 对 
应 的 电路 通过 最 终 的 OR 门 ， 如 图 13-14 所 示 。 当 然 ， 对 应 依据 情况 k=1 ( 即 两 路 输入 ) 的 电路 
不 是 用 分 治 法 得 到 的 ， 而 是 使 用 单个 两 输入 的 OR 门 。 
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图 13-13 ”OR 门 的 完全 二 叉 树 
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图 13-14 ”把 分 治 法 用 于 电路 设计 
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13.5.4 “习题 


(1)* 假设 我 们 使 用 户 入 为 的 OR 门 ， 并 且 想 为 n 路 输入 取 oR， 其 中 n 是 k 的 乘 方 。 这 种 电路 可 能 达到 的 
最 小 延迟 是 多 少 ? 如 果 使 用 如 图 13-12 所 示 朴 素 的 “级 联 ” 电 路 ， 延 迟 会 是 多 少 ? 

(2)* 设计 分 治 电路 执行 以 下 运算 。 每 种 电路 的 延迟 各 是 多 少 ? 

(a) 给 定 输入 x、x、…、x, ， 当 且 仅 当 所 有 输入 都 是 1 时 产生 输出 1。 
(b) 给 定 输入 Xxw…、 志 入、y…、y ， 当 且 仪 当 对 i=1、2、…、nn 有 x =yy 时 ,输出 是 1。 提 
示 : 使 用 图 13-2 所 示 电 路 测试 两 路 输入 是 否 相 等 。 

(G3) * 即使 输入 数 不 是 2 的 乘 方 ， 图 13-14 中 的 分 治 法 也 是 起 作用 的 。 那 么 依据 就 一 定 要 包括 两 输入 或 
三 输入 的 集合 ， 三 输入 集合 是 由 两 个 oR 门 处 理 的， 假设 我 们 要 把 门 的 忆 人 严格 限制 为 2， 就 要 用 
一 个 门 的 输出 作为 另 一 个 门 的 一 路 输入 。 这 种 电路 的 延 退 是 多 少 ， 将 其 表示 为 输入 数量 的 函数 。 

(4) 正 选 突击 队 准 备 就 绪 、 意 志 坚 定 并 能 够 出 击 。 假 设 有 xz 个 突击 队员 ， 而 且 电 路 输入 六 、w 和 a 分 别 
表示 第 ; 企 突击 队员 是 否 准 备 就 绪 、 意 志 坚 定 并 能 够 出 击 。 只 有 当 所 有 突击 队员 准备 就 绪 、 意 志 坚 和 定 
并 能 够 出 击 时 ， 我 们 才 派 该 突击 队 发 动 窗 击 。 设 计 分 治 电 路 ， 表 示 我 们 能 否 派 该 突击 队 发 动 袭 击 。 

(3) * 候补 突击 队 ( 顺 着 习题 (4) 的 思路 ) 没有 这 人 么 专业 。 如 果 各 突击 队员 处 在 准备 就 绪 、 意 志 坚 定 或 
能 够 出 击 的 状态 ， 就 派 这 文 队 伍 发 动 准 击 。 其 实 ， 即 便 至 多 有 一 个 突击 队员 既 没 有 准备 就 绕 ， 也 
不 意志 坚定 ， 并且 不 能 够 出 击 ， 我们 也 派出 这 文 队伍。 使 用 与 习题 (4) 一 样 的 输入 , 设计 能 表示 我 
们 能 和 否 派 候补 突击 队 发 动 袭 击 的 分 治 电路 。 


13.6 分 治 加 法 电路 


将 两 个 数字 相 加 的 电路 是 计算 机 的 关键 部 分 之 一 。 尽 管 实际 的 微 处 理 需 电路 所 做 的 事 更 多 ， 
但 我 们 这 里 要 通过 设计 将 两 个 非 负 整 数 相 加 的 电路 ， 研 究 该 问题 的 本 质 。 这 一 问题 是 一 个 相当 
有 启发 性 的 分 治 电路 设计 示例 。 

我 们 可 以 按照 若干 种 连接 方法 中 的 某 一 种 ， 用 n 个 一 位 加 法 右 构 建 n 位 数字 的 加 法 器 。 假 设 
使 用 图 13-10 所 示 电 路 作为 一 位 加 法 器 电路 。 该 电路 的 延迟 是 3， 接 近 我 们 能 达到 的 最 低 延 迟 。” 
最 简单 的 加 法 器 构建 方式 是 我 们 在 1.3 节 中 看 到 过 的 行 波 进位 加 法 器 。 在 该 电路 中 , 各 一 位 加 法 
器 的 输出 都 要 称 为 下 一 个 一 位 加 法 需 的 输入 ， 所 以 把 两 个 zr 位 数字 相 加 会 带 来 3 的 延迟 。 例 如 ， 
如 果 是 n=32 的 情况 ,那么 该 电路 的 延迟 就 是 96。 


13.6.1 递归 加 法 电路 


如 果 使 用 分 治 策略 ， 设 计 处 理 w2 位 的 电路 ， 并 使 用 两 个 这 样 的 电路 以 及 其 他 一 些 补充 电路 
构成 z 位 加 法 需 ， 了 驶 可 以 让 设计 出 的 加 法 需 电路 的 延迟 显著 减少 。 在 示例 13.6 中 ， 我 们 讨论 过 使 
用 两 输入 OR 门 为 很 多 位 取 OR 的 分 治 电路 。 这 是 个 特别 简单 的 分 治 法 应 用 示例 ， 因 为 各 个 更 小 的 
电路 执行 的 刚好 是 所 需 的 功能 ( OR )， 而 且 子 电路 的 输出 组 合 是 非常 简单 的 (它们 被 提供 给 OR 
门 )。 这 两 个 大 小 减 半 的 电路 可 以 同时 ( 并行 ) 处 理 它 们 的 工作 ， 所 以 它们 的 延迟 不 会 到 加 。 

对 加 法 器 来 说 ， 我 们 需要 完成 一 些 更 微妙 的 工作 。 比 较 简 单 的 做 法 是 使 用 同样 的 大 小 减 半 
的 加 法 带电 路 将 左 半 部 分 的 位 〈 高 序 位 ) 相 加 ， 并 把 右 半 部 分 的 位 〈 低 序 位 ) 相 加 。 不 过 ,与 7 
位 OR 的 例子 中 可 以 独立 地 处 理 左 半 部 分 和 右 半 部 分 不 同 的 是 ， 对 加 法 需 来 说 ， 似 乎 要 在 右 半 部 























J 通过 在 全 加 器 之 外 为 所 有 输入 求 补 ,然后 在 全 加 器 中 计算 进位 和 它 的 补 数 , 就 可 以 设计 更 为 复杂 但 延迟 为 2 的 一 
位 加 法 需 电 路 。 
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分 完成 计算 , 并 如 图 13-15 所 示 把 进位 传递 给 左 半 部 分 的 最 右 位 之 后 , 左 半 部 分 才 可 以 开始 计算 。 
如 果 这 样 的 话 ， 我 们 会 发 现 ， 这 种 所 谓 的 “分 治 ” 电 路 其 实 就 和 行 波 进位 加 法 需 是 一 样 的 ， 而 
且 根 本 没有 改善 延迟 。 


Z1 Yl “Tn/2 Yn/2 


济 位 Tn/2+1Yn/2+1 *** Yn Yn 





左 半 加 法 器 右 半 加 法 器 


Z1 2 A Sn/2 Sn/24+1 Zn/2+2 Zn 
图 13-15 无效 的 加 法 器 分 治 设 计 
我 们 需要 认识 到 的 加 法 “ 诀 宅 ” 是 ， 在 要 计算 的 不 仅 是 和 的 条 件 下 ， 我 们 可 以 在 不 知道 右 





半 部 分 进位 输出 的 情况 下 计算 左 半 部 分 。 这 里 就 需要 回答 两 个 问题 。 第 一 个 ， 如 果 没 有 进位 进 
入 左 半 部 分 的 最 右 位 置 ， 和 会 是 多 少 ,以 及 第 二 个 , 如 果 存 在 进位 输入 ， 和 会 是 多 少 ? "然后 就 
可 以 让 电路 的 左 半 部 分 和 右 半 部 分 同时 计算 它们 的 答案 。 一 般 两 个 部 分 的 计算 都 已 完成 ， 就 可 
以 弄 清 是 否 有 从 右 半 部 分 到 左 半 部 分 的 进位 。 这 会 告诉 我 们 哪个 结果 是 正确 的 ， 而 且 青 经 过 三 
个 单位 的 延迟 ， 就 可 以 为 左边 选 出 正确 答案 。 因 此 ， 把 zx 位 相 加 的 延迟 只 比 把 w2 位 相 加 的 延迟 
多 3, 这 样 就 使 电路 的 延迟 是 3Q +1log,n) 。 对 n=32 来 说 ,， 这 要 比 行 波 进 位 加 法 器 好 很 多 了 , 分 
治 加 法 器 的 延迟 是 3(1+log,32) =3(+5)=18 ， 而 行 波 进位 加 法 器 的 延迟 是 96。 

更 为 准确 地 讲 ， 我 们 将 n 位 加 法 器 定义 为 具有 表示 两 个 n 位 整数 的 输入 、x,、…、X 和 
yr yx、 以 及 如 下 输出 的 电路 。 

(1) ss、s…、5,， 输 入 的 n 位 和 (不 包括 最 左 位 置 的 进位 输出 , 即 不 包括 超出 属于 x 和 yi 的 
位 置 )， 假设 最 右 的 位 置 (x, 和 yy 的 位 置 ) 没有 进位 输入 。 

(2) f、b…、t,， 输 入 的 n 位 和 ， 假 设 最 右 的 位 置 有 进位 输入 。 

(3)p， 进 位 传送 位 ( carry-propagate bit )， 在 假设 最 右 位 置 有 进位 输入 的 情况 下 ， 如 果 最 左 
位 置 存 在 进位 输出 ， 则 它 的 值 是 1。 

(4) g, 进位 发 生 位 ( carry-generate bit )， 即 便 最 右 位 置 没 有 进位 输入 ， 如 果 最 左 位 置 有 进位 
输出 ， 其 值 为 1。 

要 注意 到 有 g 一 p， 也 就 是 说 ， 如 果 g 是 1， 则 pp 一定 是 1。 不 过 , g 可 以 是 0， 而 同时 p 仍 是 1。 
例如 ， 如 果 x 是 1010…， 而 y 是 0101…， 那么 g=0， 因 为 在 没有 进位 输入 时 ， 求 出 的 和 全 是 1， 而 
旦 最 左 位 置 没 有 进位 输出 。 男 一 方面 ， 如 果 最 右 位 置 有 进位 输入 ， 那 么 后 n 位 的 和 全 部 是 0， 而 
且 最 左 位 置 有 进位 输出 ， 因 此 p = 1。 

我 们 要 为 2 的 乘 方 递归 地 构建 na 位 加 法 髓 。 

依据 。 考 虑 n=1 的 情况 。 这 里 有 两 路 输入 ，x 和 y， 而 且 需 要 利用 以 下 人 逻 辑 表达 式 计算 四 路 
输出 s、t、p 和 和 g: 


























(请 注意 ,“ 存 在 进位 输入 ”表示 进位 输入 是 1， 而 “没有 进位 输入 ”意味 着 进位 输入 是 0。 
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S=Xy+Xy 
t=Xy+xXy 
8=Xy 
P=X+y 
要 知道 这 些 表 达 式 为 什么 是 正确 的 ， 首 先 要 假设 所 考虑 的 这 个 位 置 没 有 进位 输入 。 当 x、y 
和 进位 输入 中 有 奇数 个 1 时 就 是 1 的 和 值 位 ， 在 x 和 y 中 刚好 有 一 个 是 1 的 情况 下 才 是 1。 上 述 对 应 s 
































的 表达 式 显 然 具 有 这 一 属性 。 此 外 , 在 没有 进位 输入 的 情况 下 ， 只 有 在 x 和 ) 都 是 1 时 才 会 有 进位 
输出 ， 这 就 解释 了 上 面 对 应 g 的 表达 式 。 
yh y 
也 
7 
y 
7 
S 9 t 了 


图 13-16 ”依据 情况 : 一 位 加 法 器 


现在 假设 存在 进位 输入 。 那 么 对 x、y 和 进位 输入 中 有 奇数 个 1 的 情况 ， 就 一 定 是 x 和 y 同 为 1 
或 同 不 为 1!1， 这 解释 了 对 应 的 表达 式 。 还 有 ， 现 在 如 果 x 和 y 中 有 一 个 是 1 或 者 两 个 全 是 1， 就 会 
有 进位 输出 了 ， 这 就 说 明了 对 应 p 的 表达 式 是 正确 的 。 对 应 该 依据 情况 的 电路 如 图 13-16 所 示 。 
它 从 思路 上 讲 与 图 13-10 所 示 的 全 加 需 是 类 似 的 , 不 过 实际 上 它 多 少 要 简单 一 些 , 因为 它 只 有 两 
路 输入 。 

归纳 。 归 纳 步 又 如 图 13-17 所 示 ， 其 中 用 两 个 zx 位 加 法 器 构建 了 一 个 2 位 加 法 器 。27 位 加 法 
需 是 由 两 个 xz 位 加 法 需 , 加 上 两 块 图 13-17 所 示 的 标号 为 FIX 的 电路 组 成 的 , 其 中 FIX 电 路 是 用 来 
处 理 以 下 两 个 问题 的 。 

(1) 为 2 位 加 法 需 计 算 进 位 传送 位 和 进位 发 生 位 。 

(2) 调整 :和 的 左 半 部 分 ， 以 考虑 是 否 具有 从 右 半 部 分 到 左 半 部 分 的 进位 。 
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图 13-17 分 治 加 法 器 设计 草图 


首先 ， 假 设 2n 位 加 法 器 整个 电路 的 右 端 有 进位 输入 。 然 后 ， 如 果 以 下 两 个 条 件 有 任何 一 个 
成 立 ， 那 么 整个 电路 左 端 会 有 进位 输出 。 

(a) 加 法 右 的 左 半 部 分 和 右 半 部 分 都 会 传送 进位 ， 也 就 是 说 ，p“p"” 为 真 。 请 注意 ， 这 一 表 
达 式 包含 了 右 半 部 分 产生 进位 ， 而 左 半 部 分 传送 该 进位 的 情况 。 那 么 pp" 为 真 , 但 g 一 p”， 
(pp +p’p")=p’p"。 

(b) 左 半 部 分 产生 进位 ， 也 就 是 说 ，g” 为 真 。 在 这 种 情况 下 ， 左 端 进位 输出 的 出 现 并 不 取 
决 于 右 端 是 否 有 进位 输入 ， 也 不 取决 于 右 半 部 分 是 否 产 生 了 进位 。 

因为 ， 对 应 2m 位 加 法 需 的 进位 传送 位 pz 的 表达 式 是 

p=g +p’p" 

现在 假设 27 位 加 法 需 的 右 端 没 有 进位 输入 。 那 么 只 有 出 现 了 以 下 两 种 情况 之 一 ，27 位 加 法 
器 的 左 端 才 会 有 进位 输出 。 

(a) 右 半 部 分 产生 了 进位 ， 而 且 左 半 部 分 传送 了 该 进位 ; 

(b) 左 半 部 分 产生 了 进位 。 
因此 ， 对 应 g 的 逻辑 表达 式 是 




















g=g 二 PS 
现在 把 注意 力 转 到 这 些 s 和 上 上。 首先 ， 右 半 部 分 的 位 与 右 侧 z 位 加 法 需 的 输出 相 比 没有 改变 ， 
因为 左 半 部 分 的 出 现 不 会 对 右 半 部 分 造成 影响 ,因此 ,对 i=1.2、….n, 有 s,s=s* ,而 且 1 = 以 。 

不 过 ， 左 半 部 分 的 位 必须 经 过 修改 ， 从 而 把 右 半 部 分 产生 进位 的 情况 考虑 在 内 。 首 先 ， 假 

设 2n 位 加 法 器 的 右 端 没有 进位 。 这 种 情况 应 该 是 由 s, 告诉 我 们 ， 从 而 可 以 为 左 半 部 分 的 8s 〈 也 
就 是 ss、s,、……、s, ) 设计 表达 式 。 因 为 右 半 部 分 没有 进位 输入 ,所 以 只 有 在 右 半 部 分 生成 了 进位 
的 情况 下 ， 左 半 部 分 才 有 进位 输入 。 因 此 ， 如 果 og” 为 真 ， 那么 s, = 要 (因为 太 会 告诉 我 们 当 左 
半 部 分 有 进位 输入 时 会 发 生 什 么 )。 我 们 可 以 将 其 写 为 逻辑 表达 式 

s,=5 8" +t/g” 
站， 六 让 6 和 
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最 后 ， 要 考虑 当 27 位 加 法 器 的 右 端 有 进位 输入 时 会 发 生 什 么 。 现 在 可 以 按照 如 下 方式 解决 
左 半 部 分 上 的 值 的 问题 。 如 果 右 半 部 分 传送 了 进位 的 话 ， 也 就 是 如 果 2 =1 ， 左 半 部 分 就 会 有 
进位 输入 。 因 此 ， 如 果 六 为 真 ， 则 “会 接受 妃 的 值 ， 而 如 果 p” 为 假 ，t 就 会 接受 sv 的 值 。 写 
成 逻辑 表达 式 就 是 

f=s/p +t p" 
概括 起 来 ， 图 13-17 中 标 有 FIX 的 方 框 所 表示 的 电路 会 计算 如 下 表达 式 
g=g8 +D 8 
$s,=s 8" +t ge”， 其 中 i=1、2、…、n。 
t=s'p” +trp” ， 其 中 i=1、2、…、n。 
这 些 表达 式 各 日 能 被 不 超过 3 层 的 电路 识别 。 例 如 ,最 后 那个 表达 式 只 需要 图 13-18 所 示 的 电路 。 


sit pe Et 
ti; 


图 13-18 ”FIX 电 路 的 一 部 分 








13.6.2 ”分 治 加 法 器 的 延迟 


设 DOn) 是 我 们 刚 设计 的 n 位 加 法 器 的 延迟 , 可 以 按照 以 下 方式 写 出 表示 D 的 弟 推 关系 。 对 依 
据 情 况 n=1 来 说 ， 查 看 图 13-16 中 的 依据 电路 ， 可 以 得 出 延迟 是 3。 因 此 ，D()=3。 
现在 要 看 看 网 13-17 中 电路 的 归纳 构造 。 该 电路 的 延迟 是 位 加 法 器 电路 的 延迟 ， 加 上 FIX 电 
路 的 延迟 。n 位 加 法 器 的 延迟 是 D(n) 。 而 为 FIX 电 路 设计 的 各 表达 式 都 会 带 来 一 个 不 超过 3 层 的 简 
单 电路 。 图 13-18 就 是 个 典型 的 例子 。 因 此 ，D(2n) 要 比 D(n) 多 3。 所 以 对 应 D(n) 的 递 推 关系 是 
DO =3 
D(2n)= D(n)+3 
对 那些 为 2 的 乘 方 的 位 数 来 说 ， 该 递 推 关系 的 解 有 D(1)=3，D(2)=6，D(4)=9,，D(8)=12， 
DU6) =15 ，D(32) =18 ， 等 等 。 对 2 的 乘 方 x 来 说 ， 该 递 推 关 系 的 解 是 
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D(n)=3(1+l0g, n) 
大 家 可 以 用 3.11 节 的 方法 检验 。 特 别 要 说 的 是 ， 请 注意 ， 对 32 位 加 法 器 而 言 ， 延 迟 18 要 远 少 于 
32 位 行 波 进位 加 法 器 的 延迟 96。 
13.6.3 ”分 治 加 法 器 使 用 的 门 的 数量 
我 们 还 应 该 验证 门 的 数量 是 否 合理 。 设 G(n) 是 n 位 加 法 带电 路 使 用 的 门 的 数量 。 依 据 是 
G(1)=9 , 数 出 图 13-16 所 示 电 路 中 门 的 数量 就 可 以 得 出 这 一 数字 。 然 后 看 到 图 13-17 所 示 电 路 ,也 
就 是 归纳 情况 ， 在 两 个 n 位 加 法 器 的 子 电路 中 有 2G(n) 个 门 。 除 了 这 个 量 之 外 ,还 必须 加 上 FIX 电 
路 中 门 的 数量 。 可 能 要 反 转 g* 和 P* 一次， 然后 n 个 s 和 各 需要 3 个 门 (两 个 AND 和 一 个 OR ) 来 
计算 ,也 就 是 总 共 要 6n 个 门 。 在 这 个 量 之 上 ,要 加 上 为 a” 和 P* 设 置 的 两 个 反 相 器 ， 还 必须 加 上 
计算 e 和 和 p 各 自 需 要 的 两 个 门 。 因 此 FIX 电 路 中 门 的 总 数量 是 6n+6。 这 样 对 应 G 的 弟 推 关系 是 
GD =9 
G(2n) =2G(n)+6n+6 
这 里 的 函数 还 是 只 为 2 的 乘 方 x 定义 。G 的 前 6 个 值 如 图 13-19 中 的 表 所 示 。 对 n=32， 我 们 看 
到 电路 需要 954 个 门 。 对 2 的 乘 方 x 来 说 ,表示 G(n) 的 解析 式 是 3xlog,2+1S2 -6 ， 大 家 可 以 利用 
3.11 节 中 的 技巧 来 证 明 该 表达 式 是 正确 的 。 





























图 13-19 ”多 种 z 位 加 法 器 所 使 用 的 门 的 数量 
事实 上 ， 如 果 所 需要 的 只 是 32 位 加 法 器 ， 完 全 可 以 用 更 少 的 门 来 实现 电路 。 这 样 的 话 ， 可 








知 在 第 32 位 的 右边 没有 进位 输入 ， 因 此 在 电路 的 最 后 阶段 不 需要 计算 p 以 及 t、t,、…、4, 的 值 。 
同样 ， 右 半 部 分 的 16 位 加 法 右 也 不 需要 计算 它 的 进位 传送 和 16 个 的 值 ， 而 右 侧 16 位 加 法 絮 右 半 
部 分 的 8 位 加 法 器 不 需要 计算 它 的 p 和 1:， 等 等 。 

把 分 治 加 法 右 使 用 的 门 的 数量 与 行 波 进 位 加 法 器 使 用 的 门 的 数量 相 比 是 很 有 意思 的 。 我 们 
在 图 13-10 中 设计 的 全 加 器 电路 使 用 了 12 个 门 。 因 此 ，n 位 行 波 进位 加 法 器 使 用 了 12n 个 门 ， 而 对 
n=32 来 说 ， 这 个 数字 就 是 384。 如 果 记 得 最 右 位 的 进位 输入 是 0， 还 可 以 省 掉 一 些 门 。 

可 以 看 到 ， 对 这 种 有 意思 的 情况 ， 也 就 是 对 n=32 的 情况 而 言 ， 行 波 进 位 加 法 器 尽管 要 慢 
很 多 ， 但 使 用 的 门 的 数量 却 不 到 分 治 加 法 需 的 一 半 。 此 外 ， 后 者 的 增长 率 O(nlogn) 要 高 于 行 波 
进位 加 法 器 的 增长 率 O(n) ， 所 以 随 着 n 的 增加 ， 门 数量 的 差别 会 越 来 越 大 。 不 过 ， 这 个 比率 只 
是 O(logn) 而 已 ， 所 以 门 数量 的 差别 并 不 严重 。 由 于 这 两 种 电路 所 需 时 间 ( 分 别 是 0(n) 和 
O(logn) ) 的 差别 要 更 为 明显 ， 某 种 分 治 加 法 器 几乎 用 在 所 有 的 现代 计算 机 中 。 


13.6.4 ”习题 


(1) 按照 本 节 介 绍 的 设计 方法 ， 画 出 把 4 位 (bit ) 的 数字 相 加 的 分 治 电 路 。 
CO) 设计 类 似 图 13-18 的 电路 ， 计 算 图 13-17 中 加 法 器 的 其 他 输出 ， 也 就 是 p、g 和 那些 s。 
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(3) ** 设计 接受 十 进 制 数 字 输 入 的 电路 ， 其 中 各 位 数字 是 4 个 给 出 与 该 十 进 制 数字 等 价 的 二 进 制 数 字 的 
输入 表示 的 。 而 输出 的 是 与 之 等 价 的 二 进 制 表示 数字 。 大 家 可 以 假设 数字 ( digit ) 的 数量 是 2 的 乘 方 ， 
并 使 用 分 治 法 。 提 示 : 左 半 部 分 的 电路 〈 高 位 数字 ) 需要 来 自 右 半 部 分 ( 低位 数字 ) 的 哪些 信息 ? 
(4)* 证 明 ， 对 2 的 乘 方 x 而 言 ， 如 下 递 推 关 系 的 解 是 D(n)=3(1+log,n)。 
DO =3 
D(2n) = D(n)+3 
(5)* 证 明 ， 对 2 的 乘 方 x 而 言 ， 如 下 递 推 关 系 的 解 是 G(n)=3nlog,n+15n 一 6。 
GCC =9 


G(2n) =2G(n) +6n+6 
(6) ** 我 们 注意 到 ， 如果 所 需要 的 只 是 32 位 加 法 右 ， 就 不 需要 图 13-19 给 出 的 全 部 954 个 门 。 原因 在 于 ， 


可 以 假设 32 位 中 最 右 的 位 置 没 有 进位 输入 。 那 么 实际 上 需要 多 少 个 门 ? 

















13.7 多 路 复 用 器 的 设计 
多 路 复 用 器 ( multiplexer ) 通常 简写 为 MUX， 是 一 种 常见 的 计算 机 电路 ， 它 接受 d 路 控制 输 
入 ， 比 方 说 是 x、x,、…、xj ， 以 及 2 路 数据 输入 ， 比 方 说 是 y、yp…、y,，， 如 图 13-20 所 示 。 
MUX 的 输出 等 于 特定 的 数据 输入 ,输入 yy, 。 也 就 是 说 ， 把 控制 输入 当 作 0 到 2 -1 范围 内 
的 二 进 制 整数 ， 该 整数 是 要 传递 给 输出 的 数据 输入 的 下 标 。 
数据 输入 
Yo Yl1 “Vd =1 


控制 输入 .……… 


Taq 





VY (T17224), 
图 13-20 ”多 路 复 用 器 电路 概要 图 
+ 示例 13.7 
分 治 加 法 右 中 计算 s 和 上 的 电路 就 是 &=1 的 多 路 复 用 器 。 例 如 对 应 s 的 公式 是 
5% 5 到 + 大 8 ， 而 它 的 电路 概要 图 就 如 图 13-21 所 示 。 这 里 ，g 所 扮演 是 控制 输入 2 的 角色 ，sw 


则 是 数据 输入 y, ， 而 要 是 数据 输入 yi。 
再 举 个 例子 ， 具 有 两 个 控制 输入 x 和 x,， 以 及 4 个 数据 输入 y,、y、 


出 公式 是 


)2 和 )3 的 MUX 的 输 


Jo + VX Xs + yo XX + y3XiX 


13.7 多 路 复 用 器 的 设计 583 





si = 389t + ttge 
图 13-21 1- 复 用 器 


这 里 对 应 各 数据 输入 的 都 分 别 只 有 一 项 。 而 具有 数据 输入 yy, 的 项 也 含有 两 个 控制 输入 ， 要 么 是 
否定 的 ， 要 人 么 是 非 否定 的 。 通 过 把 写 为 4 位 的 二 进 制 整数 ， 我 们 可 以 推断 出 哪些 控制 输入 是 否 
定 的 。 如 果 二 进 制 的 区 痊 位置 是 0, 那么 x, 就 是 否定 的 , 而 如 果 第 y 个 位 置 是 1, 就 不 为 x, 取 反 。 
请 注意 ， 这 一 规则 对 任意 数量 4 的 控制 输入 都 是 有 效 的 。 

一 种 简单 的 多 路 复 用 右 设 计 是 使 用 具有 3 级 门 的 电路 ,在 第 一 级 中 ,要 计算 各 控制 位 的 否定 。 
接 下 来 的 一 级 是 一 行 AND 门 。 第 i 个 门 会 把 数据 输入 y 与 恰当 的 控制 输入 及 取 反 控制 输入 组 合 结 
合 起 来 。 因 此 ， 除 了 控制 位 被 置 为 的 二 进 制 表 示 时 第 i 个 门 的 输出 是 y, ， 其 他 情况 下 该 门 的 输 
出 总 是 0。 最 后 一 级 是 一 个 oR 门 ， 它 的 输入 来 自 上 一 级 的 各 AND 门 。 因 为 所 有 AND 门 中 除了 一 个 
之 外 输出 都 是 9， 而 这 唯一 一 个 输出 不 为 0 的 AND 门 ， 比 方 说 是 第 i 个， 它 的 输出 是 y, ， 所 以 电路 
的 输出 就 等 于 y,。4d = 2 时 该 电路 的 样子 如 图 13-22 所 示 。 


yo JI 22 V3 
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图 13-22 ”4 =2 的 多 路 复 用 器 电路 
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13.7.1 分 治 多 路 复 用 器 


图 13-22 所 示 电 路 的 最 大 确信 是 4, 一 般 来 说 这 是 可 以 接受 的 。 不 过 随 着 4 逐渐 变 大 ,OR 门 的 
扇 人 2? 之 大 就 变 得 不 可 接受 了 。 即 便 是 各 自 只 有 d+1 路 输入 的 AND 门 ， 也 开始 有 着 无 法 让 人 满 
意 的 大 局 入 ,好 在 基于 对 控制 位 对 半分 割 的 分 治 法 让 我 们 可 以 用 户 入 至 多 为 2 的 门 来 构建 这 样 的 
电路 。 此 外 ， 假 如 要 求 所 有 电路 都 是 用 具有 相同 扇 人 限制 的 门 构建 的 ， 这 一 电路 使 用 的 门 就 会 
少 很 多 ， 而 且 几 乎 和 图 13-22 所 示 的 一 般 电 路 一 样 快 。 

我 们 把 具有 4d 路 控制 输入 和 2" 路 数据 输入 的 多 路 复 用 器 称 为 CLMUX， 那 么 这 类 多 路 复 用 器 
电路 的 归纳 构建 如 下 所 述 。 

依据 。 依 据 是 &=1 时 的 多 路 复 用 器 电路 ， 也 就 是 1-MUX， 如 图 13-23 所 示 。 它 由 4 个 情人 被 
限制 为 2 的 门 组 成 。 








20 Yl1 


图 13-23 ”依据 电路 ，4 =1 时 的 多 路 复 用 器 


归纳 。 归 纳 是 由 图 13-24 所 示 电 路 进行 的 ， 它 是 用 2 +1 个 4-MUX 构 建 了 一 个 24-MUX。 请 
注意 ， 尽 管控 制 输入 的 数量 只 是 翻 倍 ， 数 据 输入 的 数量 却 变 为 之 前 的 平方 ， 因 为 2” = (2”)。 
假设 24-MUX 的 控制 输入 需要 数据 输入 y, ， 也 就 是 
i= (XX NX ); 
图 13-24 中 顶部 那 行 4-MUX 接 受 一 组 从 某 个 y, 开 始 的 2° 路 数据 和 输入， 这 里 /是 2 的 倍数 。 因 此 ， 
如 果 用 低 序 的 dq 个 控制 位 x,,，、…、x, 来 控制 各 个 4-MUX, 所 选择 的 输入 就 是 各 组 中 的 第 k 个 (各 
组 中 最 左 侧 的 输入 被 记 为 输入 0 )， 其 中 














k= (xan Xa) 


也 就 是 说 ，k 是 由 低 序 那 一 半 中 的 位 表示 的 整数 。 
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V0..…Y24—1 424…Vy2x24 一 1 Y(24—1)24..Y224—1 


dil 必 d 十 1 必 d 十 1 
A ad-MUX Sn ad-MUX EN Ep 
Tod Tod TX2d 





VY(z17x2..724)2 


图 13-24 “分 治 多 路 复 用 需 


底部 4-MUX 的 输入 是 顶部 那 行 4-MUX 的 输出 ,我们 刚 得 出 它们 是 yy、yp,、y,、…、 
yw_yxmw。 底部 的 4-MUX 是 由 %…x 控制 的 ， 它 表示 某 个 二 进 制 整数 ， 也 就 是 j= (x…xy),。 
因此 底部 的 多 路 复 用 器 会 选择 它 的 第 /个 〈 最 左 侧 的 输入 被 记 作 输 入 0 ) 输入 作为 其 输出 。 因 此 
被 选 定 的 输入 是 了 wu 。 

可 以 按照 如 下 方式 证 明 j2” +k=i。 请 注意 ， 用 ] 滋 以 2 会 把 /的 二 进 制 表示 向 左 移动 4 个 位 
置 。 也 就 是 说 j2” = (x,…x,0…0), ， 其 中 这 串 0 的 长 度 是 z。 因 此 ，72? + 大 的 二 进 制 表 示 就 是 
人 2 。 这 是 因为 k 的 二 进 制 表示 是 (xx )，， 而 且 当 这 个 数字 被 加 到 最 后 是 4 
个 0 的 j2” 时 ,从 右 起 的 第 dz 位 显然 没有 进位 输出 。 现 在 可 知 j2” + 大 = ,因为 它们 有 着 相同 的 二 
进 制 表 示 。 因 此 图 13-24 所 示 的 24-MUX 正 确 地 选 出 了 x,， 其 中 i= (x…x,),。 


13.7.2 分 治 MUX 的 延迟 


可 以 通过 写 出 适当 的 递 推 关系 来 计算 所 设计 多 路 复 用 器 电路 的 延迟 。 设 D(d) 是 4-MUX 的 
延迟 。 观 察 图 13-23 可 知 ， 对 4 =1， 延 迟 是 3。 不 过 ， 要 得 到 更 紧密 的 边界 ， 就 要 假设 所 有 的 控 
制 输入 都 要 经 过 MUX 外 的 反 相 器 ， 而 且 它 们 不 能 算 在 图 13-23 所 示 反 相 邦 的 那 层 中 。 所 以 在 确 
定 了 电路 其 余部 分 的 延迟 之 后 , 要 在 总 延迟 上 加 1, 从 而 把 所 有 控制 输入 的 反 相 产生 的 延迟 计算 
在 内 。 因 此 ， 我 们 的 递 推 关系 是 从 DG) = 2 开始 的 。 

对 于 归纳 部 分 ， 我 们 注意 到 经 过 网 13-24 所 示 电 路 的 延迟 是 经 过 上 方 那 行 MUX 中 任何 一 个 
的 延迟 ， 加 上 经 过 最 后 一 个 MUX 的 延迟 。 因 此 ，D(2d) 就 是 D(d) 的 两 倍 ， 所 以 弟 推 关系 为 

DU)=2 

D(24) = 2D(a) 
解 是 很 容易 得 出 的 。 我 们 有 D(2) =4 ，D(4) =8 ，D(8) =16, 而 一 般 来 说 就 是 D(q) = 24 。 当然， 
严格 地 讲 ， 这 一 公式 只 有 在 4 是 2 的 乘 方 时 才 成 立 ， 不 过 同样 的 思路 也 可 以 用 于 任意 数量 的 控制 
位 dg。 因 为 我 们 必须 加 上 为 控制 输入 反 相 所 造成 的 延迟 1， 所 以 该 电路 的 总 延迟 就 是 24+ 1。 
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现在 考虑 简单 多 路 复 用 器 电路 ( 每 个 数据 输入 对 应 一 个 AND 门 ,其 输出 都 提供 给 一 个 OR 门 )。 
正如 之 前 所 说 的 ， 它 的 延迟 是 3， 与 4 无 关 ， 不 过 一 般 来 说 不 可 能 这 样 构建 电路 ， 因 为 最 终 那 个 
OR 门 的 扇 和 是 不 现实 的 。 如 果 坚 持 将 遍 和 人 限 制 为 2 会 怎样 呢 ” 这 样 一 来 ， 有 着 2" 路 输入 的 最 后 
那个 oR 门 会 被 有 着 d 层 的 完全 二 义 树 替代 。 回 想 一 下 ， 这 样 一 棵 树 将 会 有 2 个 叶子 节点 ， 刚 好 
就 是 正确 的 数量 ， 而 这 棵 树 的 延迟 是 d。 

我 们 还 要 用 由 忆 和 人 为 2 的 AND 门 构成 的 树 奉 代 这 些 AND 门 ， 因 为 一 般 来 说 这 些 AND 门 具有 
d +1 路 输入 。 回 想 一 下 ,在 使 用 具有 两 路 输入 的 门 时 ,每 使 用 一 个 门 就 会 将 输入 的 数量 减少 1， 
所 以 需要 4 个 扇 入 为 2 的 门 才 能 把 4+1 路 输入 减少 到 1 路 输入 。 如 果 将 门 安排 成 aND 门 构成 的 平衡 
二 叉 树 ， 就 需要 log,dg+1l 层 。 在 加 上 为 控制 输入 反 相 的 一 层 之 后 ， 就 得 到 总 延迟 是 
d+l+(log,d+D 。 如 图 13-25 中 的 表 所 示 ， 虽 然 这 与 分 治 MUX 那 24g+1 的 延迟 相 比 差别 不 大 ， 














但 该 图 还 是 好 意 地 对 其 进行 了 比较 。 


延迟 
分 治 MUX 简单 MUX 








图 13-25 ”两 种 不 同 多 路 复 用 需 设 计 的 延迟 


13.7.3” 门 的 数量 


本 市 中 要 比较 简单 MUX 和 分 治 MUX 中 门 的 数量 。 我 们 会 看 到 ， 随 着 4 的 增加 ， 分 治 MUX 
所 含 的 门 明显 要 更 少 。 
要 计算 分 治 MUX 中 门 的 数量 ， 可 以 暂时 忽略 反 相 器 。 我 们 知道 ， 这 d 路 控制 输入 各 要 被 反 
相 一 次 ， 所 以 最 后 再 在 得 出 的 数量 上 加 cd 就 行 了 。 设 G(g) 是 ZMUX 中 〈 除 反 相 央 之 外 的 ) 用 到 
的 门 的 数量 。 那 么 可 以 按照 如 下 方式 给 出 它 的 递 推 关系 。 
依据 。 依 据 情况 是 4 =1 的 情况 ， 如 图 13-23 中 的 电路 那样 ， 除 了 反 相 器 之 外 有 3 个 门 。 因 此 
G()=3。 
归纳 。 对 归纳 部 分 来 说 ， 图 13-24 中 的 24-MUX 是 用 2 +1 个 人 MUX 构 建 的 。 
因此 ， 递 推 关 系 就 是 
G(1) =3 
G(24)= (2 +1)G(q) 
正如 我 们 在 3.11 市 中 看 到 过 的 ， 该 递 推 关系 的 解 是 
G(d) =3(27 -1) 
这 一 递 推 关系 的 前 几 个 值 分 别 是 GC2) =9，G(4) =45 和 G(8) =765 。 
现在 来 考虑 在 只 使 用 扇 人 为 2 的 门 时 ， 简 单 MUX 使 用 的 门 的 数量 。 和 之 前 一 样 ， 我 们 会 忽 
略为 控制 输入 反 相 所 需 的 d 个 反 相 器 。 最 后 的 OR 门 要 用 一 棵 有 2” -1 个 oOR 门 的 树 代 替 。2“ 个 AND 
门 各 会 被 一 棵 有 4 个 AND 门 的 树 替代 。 因此 , 总 的 门 数 量 就 是 2"(d+D -1。 该 函数 要 比分 治 MUX 
中 门 的 数量 多 ， 多 的 幅度 大 约 是 (d+1)/3 。 图 13-26 比 较 了 两 种 MUX 中 门 的 数量 ， 每 种 情况 都 
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不 包括 4 个 反 相 骨 。 


门 数 量 
分 治 MUX 简单 MUX 


3 





11 

79 

2303 
196605 1114111 


图 13-26 ”两 种 不 同 多 路 复 用 需 设 计 《〈 不 包括 反 相 髓 ) 的 门 数量 








有 关 分 治 的 更 多 内 容 
本 节 的 多 路 复 用 器 设计 所 表示 的 这 种 分 治 算法 是 一 种 虽 很 少见 但 很 强大 的 形式 。 大 多 数 分 
治 的 例子 都 会 把 问题 一 分 为 二 。 这 些 例子 包括 归并 排序 、13.6 节 中 设计 的 快速 加 法 器 ， 以 及 用 
来 计算 大 量 位 的 AND 或 OR 的 完全 二 又 树 。 在 多 路 复 用 器 中 ， 是 用 d+1 个 更 小 的 MUX 来 构建 一 
个 24-MUX。 换 名 话说， 具有 n=2” 路 数据 输入 的 MUX 是 由 Vn+l 个 小 MUX 构 建 的 。 





13.7.4 ”习题 


(1) 利用 本 节 介 绍 的 分 治 技巧 ， 构 建 
(a) 2-MUX 
(b) 3-MUX 

(2) * 大 家 会 如 何 构建 那些 数据 输入 的 数量 不 是 2 的 乘 方 的 多 路 复 用 髓 ? 

(G3) * 利用 分 治 技巧 设计 独 热 码 解 码 器 ( one-hot-decoder ) 。 该 电路 接受 4 路 输入 x 、x、...、%， 
并 有 2” 路 输出 y。、yy、.…、ys_ 1。 这 些 输出 中 刚好 有 一 个 是 1, 具体 来 说 就 是 满足 i= (x,x,…,xy)， 
的 y,。 那 么 该 电路 的 延迟 ( 表示 为 4 的 函数 ) 是 多 少 ? 它 要 使 用 多 少 个 门 ( 表示 为 4 的 函数 )? 提 
示 : 有 多 种 方法 。 一 种 电路 设计 方式 是 为 前 d -1 路 输入 使 用 一 个 独 热 码 解码 器 ， 并 将 该 解码 器 
的 各 输出 分 成 基于 最 后 一 个 输入 x 的 两 路 输出 。 第 二 种 方式 是 假设 4 是 2 的 乘 方 ， 从 两 个 独 热 码 
解码 器 开始 ， 一 个 对 应 前 4 /2 路 输入 ， 而 另 一 个 则 对 应 后 4 /2 路 输入 。 然 后 恰当 地 将 这 些 解 码 
器 的 输出 结合 起 来 。 

(4) * 通过 为 各 路 输出 创建 一 个 AND 门 ， 并 为 这 些 门 提供 恰当 的 输入 或 反 相 的 输入 ， 可 以 构建 出 一 种 
独 热 码 解码 器 ,大 家 在 习题 (3) 中 设计 的 电路 与 这 种 显 见 的 设计 相 比 , 延 运 和 门 的 数量 各 是 多 少 ? 
如 果 将 大 忆 入 的 AND 门 用 两 输入 的 门 代替 , 那么 本 题 中 的 电路 与 习题 (3) 中 设计 的 电路 相 比 又 是 什 
么 情况 ? 

(5) * 多 数 电路 ( majority circuit ) 接受 2g -1 路 输入 ， 并 只 有 一 路 输出 。 如 果 有 qd 路 或 d 路 以 上 的 输入 
是 1, 那么 它 的 输出 是 1。 设 计 分 治 多 数 电 路 。 延 迟 和 门 的 数量 各 是 多 少 ( 表示 为 4 的 函数 )? 提示 : 
和 13.6 节 中 的 加 法 器 一 样 ， 利 用 计算 比 我 们 所 需 更 多 的 电路 能 最 好 地 解决 该 问题 。 特 别 要 指出 的 
是 ， 可 以 设计 接受 n 路 输入 并 具有 n+1 路 输出 y 、y 、…、y 的 电路 。 如 果 刚 好 有 i 个 输入 是 1， 
输出 y 就 是 1。 然 后 可 以 用 习题 (3) 中 提 到 的 两 种 方式 中 的 任意 一 种 归纳 地 构建 多 数 电路 。 

(6) * 有 一 种 幼稚 的 多 数 电路 设计 ， 它 是 通过 为 每 个 4 路 输入 组 设置 一 个 AND 门 米 构 建 的 。 这 种 多 数 电 
路 的 输出 是 所 有 这 些 AND 门 的 OR。 与 习题 (5) 设 计 的 分 治 电 路 相 比 ， 这 种 幼稚 设计 的 延 汉 和 门 的 数 
量 各 是 多 少 ? 如 果 用 两 输入 门 代 蔡 这 种 幼稚 设计 中 的 门 呢 ? 
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13.8 存储 单元 


在 结束 逻辑 电路 这 一 主题 之 前 ,我们 还 要 考虑 一 类 非常 重要 的 时 序 电路 。 存 储 单元 (memory 
element ) 是 由 一 系列 的 门 构成 的 电路 ， 它 可 以 记 住 它 的 上 一 个 输入 ， 并 将 这 个 输入 作为 它 的 输 
出 ， 不 管 这 个 输入 已 经 给 定 多 久 。 计 算 机 的 主 存 是 由 一 些 特定 的 位 组 成 的 ， 这 些 位 可 以 存 人 值 
而 且 会 保留 它们 的 值 直 到 另 一 个 值 被 存 人 。 


load > Db 








)» out 


图 13-27 存储 单元 


图 13-27 就 展示 了 一 个 简单 的 存储 单元 。 它 是 由 称 为 /oad 的 输入 控制 的 。 一 般 来 说 ，/oad 的 
值 是 0。 在 这 种 情况 下 ， 反 相 右 a 的 输出 就 是 1。 因 为 只 要 有 一 路 输入 是 0，AND 门 的 输出 就 是 0， 
所 以 只 要 /oad 是 0， 则 AND 门 c 的 输出 一 定 是 0。 

如 果 1oaqd =0 而 且 门 4 的 输出 (也 就 是 该 电路 的 输出 ) 是 1， 那 么 门 2 的 两 路 输入 都 是 1， 这 
样 它 的 输出 也 是 1。 因 此 ，oR 门 4 的 输入 之 一 是 1， 这 样 它 的 输出 就 仍然 是 1。 另 一 方面 ， 假 设 d 
的 输出 是 0。 那 么 AND 门 2 的 某 一 输入 是 0， 这 意味 着 它 的 输出 是 0。 这 使 得 dg 的 两 路 输入 都 是 0， 
所 以 只 要 load =0 ，d 的 输出 就 会 保持 为 0。 于 是 可 以 得 出 结论 : 只 要 oad = 0 ,电路 的 输出 就 可 
以 保持 它 原来 的 样子 。 

















真正 的 存储 芯片 


我 们 不 应 该 认为 图 13-27 精 确 地 表示 了 典型 的 寄存 器 位 ， 但 它 也 不 是 很 不 靠 谱 。 尽 管 它 也 
表示 了 主 存 的 位 ,至少 原 则 上 讲 如 此 ,但 它们 之 间 还 是 存在 着 明显 的 区 别 , 而 且 很 多 与 存储 芯 
片 设计 有 关 的 内 容 都 涉及 远 超 本 书 范围 的 电子 学 细节 。 

因为 在 计算 机 和 其 他 类 型 的 硬件 中 会 用 到 海量 的 存储 芯片 ,它们 的 大 规模 生成 已 经 让 一 些 
存储 百 万 位 或 更 多 位 的 微妙 疼 片 设计 变 为 现实 。 想 知道 存储 芯片 的 致密 性 ,可 以 回想 一 下 它 的 
面积 大 约 是 1 平方 厘米 ( 10 “平方 米 )。 如 果 在 这 样 的 芯片 上 有 1600 万 位 ， 那 么 每 一 位 所 占据 的 
面积 就 等 于 6x10 平方 米 ， 或 者 说 是 2.5 微 米 见 方 的 一 块 面积 ， 记 住 ，1 微 米 是 10“ 米 )。 如 果 
线路 的 最 小 宽度 ， 或 者 说 线路 间 的 空间 是 0.3 微 米 ， 这 没有 留 多 少 空间 给 电路 构建 存储 单元 。 
更 粮 的 是 ， 我们 不 止 要 存储 位 ， 还 要 从 这 1600 万 位 中 选 出 一 位 接收 值 ， 或 是 读 取 这 1600 万 位 中 
某 一 位 的 值 。 这 一 选择 电路 还 要 占据 芯片 上 不 少 空间 ， 留 给 存储 单元 的 空间 就 更 少 了 。 





现在 考虑 7oad =1 时 的 情况 。 反 相 带 a 的 输出 现在 是 9， 这 样 一 来 ，AND 门 b 的 输出 也 将 是 0。 
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另 一 方面 ，AND 门 c 的 第 一 路 输入 是 1， 所 以 ce 的 输出 就 与 输入 in 是 相同 的 。 同 样 ， 因 为 OR 门 4 的 
第 一 路 输入 是 0， 所 以 q 的 输出 和 c 的 输出 是 一 样 的 ， 这 和 电路 输入 in 也 是 相同 的 。 因 此 ， 将 load 
置 为 1 会 使 电路 的 输出 变 成 in。 在 把 load 变 回 O 时 , 电路 输出 会 继续 在 门 ; 和 4d 之 间 来 回 , 正如 前 文 
讨论 过 的 。 

如 果 把 “电路 输入 ”解释 为 load 为 1 时 in 的 值 ， 就 可 以 说 图 13-27 中 的 电路 具有 与 存储 单元 相 
似 的 行为 。 如 果 1oad 是 0, 那么 可 以 说 不 管 in 的 值 是 什么 , 都 不 存在 电路 输入 。 通 过 把 /oad 置 为 1， 
可 以 让 该 存储 单元 接受 新 值 。 只 要 /oad 是 0， 也 就 是 说 ， 只 要 此 电路 没有 新 的 输入 ， 该 单元 就 会 
保留 这 个 值 。 


习题 


(1) 为 图 13-27 所 示 的 存储 单元 电路 画 出 类 似 图 13-6 的 时 间 图 。 
(2) 描述 一 下 , 在 如 图 13-27 所 示 的 存储 单元 中 , 如果 一 个 Qa 粒子 击 中 反 相 器 , 并 让 门 a 的 时 间 在 一 段 很 
得 的 时 间 内 与 输入 相同 (这 段 时 间 很 得 ， 并 不 足以 让 信和 号 传 遍 整 个 电路 ) ， 该 电路 的 行为 会 是 怎样 的 。 




















13.9 小结 


阅读 本 章 之 后 ， 大 家 应 该 更 加 熟悉 计算 机 中 的 电路 以 及 逻辑 是 如 何 用 来 设计 这 种 电路 的 。 
寺 别 要 说 的 是 ,本章 涵盖 了 以 下 要 点 : 

口 什么 是 门 ， 以 及 门 是 如 何 组 合 起 来 形成 电路 的 ; 

口 组 合 电 路 与 时 序 电 路 间 的 区 别 ; 

口 如 何 根据 逻辑 表达 式 设计 组 合 电路 ， 以 及 如 何 用 逻辑 表达 式 表示 组 合 电路 的 模式 ; 

D 诸如 分 治 法 这 样 的 算法 设计 技巧 是 如 何 用 来 设计 加 法 硕 和 多 路 复 用 融 这 样 的 电路 的 ; 

D 设计 快速 电路 要 考虑 的 一 些 因素 ; 

D 简要 表示 了 计算 机 是 如 何在 它 的 电子 电路 中 存储 二 进 制 位 的 。 
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现在 要 把 注意 力 转移 到 一 般 化 的 命题 逻辑 ， 也 就 是 “谓词 ”逻辑 或 者 说 “一 阶 ”逻辑 上 。 
谓词 是 指 返回 布尔 值 的 具有 0 个 或 更 多 变量 的 函数 。 因 此 , 谓词 可 能 有 时 为 真有 时 为 假 , 这 取决 
于 其 参数 的 值 。 例如, 我 们 将 看 到 csg(C,S,G) 这 样 的 谓词 逻辑 原子 操作 数 。 其 中 , cs8 是 谓词 名 ， 
而 C、S 和 G 则 是 参数 。 可 以 将 该 表达 式 视 作 图 8-1 中 数据 库 关 系 “课程 -学 号 -成 绩 ” 的 逻辑 表示 。 
只 要 C、S 和 G 满 足 学 号 S$ 的 学 生 在 课程 C 中 得 到 成 绩 G， 它 就 返回 TRUE， 否 则 返回 FALSE。 

用 谓词 代替 命题 变量 作为 原子 操作 数 ， 提 供 的 语言 要 比 只 涉及 命题 的 表达 式 更 为 强大 。 其 
实 ， 谓 词 逻 辑 的 表达 力 足 以 构成 很 多 实用 编程 语言 的 基础 ， 比 如 Prolog ( Programming in logic ) 
和 8.7 节 中 我 们 提 到 过 的 SQL 语言 。 谓 词 逻 辑 还 应 用 在 推理 系统 或 “专家 ”系统 中 ， 比 如 自动 化 
医疗 诊断 程序 和 定理 证 明 程序 。 




















14.1 本 章 主要 内 容 


我 们 将 在 14.2 节 介绍 谓词 。 谓词 在 正式 地 表示 思路 方面 提供 了 比 命题 变量 强大 得 多 的 能 
虽然 存在 重大 差异 ， 但 谓词 逻辑 的 设计 与 第 12 章 中 命题 逻辑 的 设计 是 可 以 类 比 的 。 

口 谓词 逻辑 的 表达 式 可 以 由 使 用 命题 逻辑 运算 符 的 谓词 构建 (14.3 节 )。 

口 “量词 ”是 命题 逻辑 中 没有 类 比 物 的 谓词 逻辑 运算 符 (14.47 )。 我们 可 以 利用 量词 陈述 
某 表 达 式 对 某 个 参数 的 所 有 值 都 为 真 ,或 陈述 该 参数 至 少 存在 一 个 值 使 得 该 表达 式 为 真 。 

口 谓词 逻辑 表达 式 的 “解释 ”是 谓词 和 变量 可 能 的 含义 (14.5 节 )， 它 们 与 命题 逻辑 中 的 真 
值 赋值 是 类 似 的 。 

口 谓词 逻辑 的 重 言 式 是 指 对 所 有 解释 都 为 真 的 表达 式 。 某 些 谓词 逻辑 的 重 言 式 与 命题 逻辑 
的 重 言 式 是 类 似 的 〈 14.6 节 )， 而 另 一 些 则 不 具 相 似 性 ( 14.7 节 )。 

口 谓词 逻辑 中 的 证 明 可 以 用 与 命题 逻辑 证 明 相 类 似 的 方式 进行 ( 14.8 节 和 14.9 节 )。 

14.10 节 要 讨论 谓词 逻辑 与 计算 问题 解答 有 关 的 含义 ， 我 们 会 发 现 以 下 现象 。 

口 命题 是 重 言 式 并 不 说 明 它 在 某 个 证 明 系 统 中 是 可 证 的 。 

口 特别 要 指出 的 是 , 哥 德 尔 不 完备 性 定理 表明 , 存在 某 种 特定 形式 的 处 理 整数 的 谓词 逻辑 ， 
在 这 种 谓词 逻辑 中 没有 哪 种 证 明 系 统 可 以 证 明 每 一 个 重 言 式 。 

口 此 外 ， 图 灵 定 理 表 明 ， 存 在 我 们 可 以 陈述 但 无 法 用 任何 计算 机 解决 的 问题 。 这 种 问题 的 
例子 之 一 是 ， 某 给 定 的 C 语 言 程 序 是 否 会 在 处 理 某 些 输入 时 进入 无 限 循环 。 
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14.2 ”谓词 


谓词 是 对 命题 变量 的 一 般 化 。 回 想 一 下 12.10 节 ， 假 设 我 们 有 3 个 命题 : r (“天 在 下 雨 ”)、 
(“ 乔 伊 带 着 使 ”) 和 w(“ 乔 伊 被 淋 湿 ”)。 还 进一步 假设 有 3 个 前 提 ， 或 者 说 我 们 假设 为 真 的 表达 
式 : 7 一 4 ( “如果 天 在 下 雨 ， 那 么 乔 伊 带 着 任 ” )、2 一 殊 〈 “如 果 乔 伊 带鱼 了， 那么 他 不 会 被 
淋 湿 ”)， 以 及 地 一 元 (如果 没 有 下 雨 ， 乔 伊 不 会 被 淋 湿 ”)。 

对 乔 伊 为 真 的 事情 对 玛丽 、 苏 还 有 比尔 等 人 也 为 真 ， 因 此 可 以 把 命题 w 看 作 4j,, ， 而 w 就 是 
。 如 果 这 样 看 的 话 ， 就 有 前 提 

7’ YU je U joe > We 和 > Wj 

如 果 定 义 命题 uj, 表示 玛丽 带 着 她 的 伞 , 并 定义 wy 表示 玛丽 被 淋 湿 , 那么 就 有 了 一 组 类 似 的 


前 提 : 








命题 w 


Joe 


Pe Wg Wp 和 天 一 Wigay 

我 们 可 以 继续 像 这 样 , 引入 命题 谈论 所 知道 的 所 有 个 体 X, 并 用 新 命题 ww 和 w 陈述 与 命题 

7 相关 的 前 提 ， 即 
rou, Ur Wr 和 7 > Wy 

现在 就 要 讲 到 谓词 的 概念 了 。 与 无 限 的 命题 集合 ww 和 wi 不同 的 是 , 可 以 将 符号 u 定 义 为 接 
受 参 数 X 的 谓词 。 表 达 式 u(X) 可 以 解释 为 在 说 “X 带 着 他 (她 ) 的 伞 "。 可 能 对 某 些 X 的 值 而 言 ， 
2(Y) 为 真 ， 而 对 其 他 X 的 值 来 说 ，u( 耻 ) 为 假 。 同 样 ，w 可 以 是 谓词 ， 粗 略 地 讲 ，w(Z) 就 表示 
“XX 被 淋 湿 ”。 

命题 变量 "也 可 以 被 当 作 具有 0 个 参数 的 谓词 。 也 就 是 说 ， 下 不 下 十 并 不 像 x 和 w 那 样 取决 于 
个 体 X。 

现在 可 以 把 前 提 用 谓词 表示 成 如 下 形式 。 

(7 一 2CZ) 。( 对 任何 个 体 X， 如 果 天 在 下 十 ， 那 么 ZX 着 他 或 她 的 伞 。) 

(2) u(X) 一 NOT w(X) 。( 不 管 你 是 谁 ， 如 果 你 带 着 伞 ， 就 不 会 被 淋 湿 。) 

(3) NOT 7 一 NOT w(X) 。( 如 果 不 下 雨 ， 那 么 没 人 会 被 淋 湿 。) 


14.2.1 原子 公式 


原子 公式 ( atomic formula ) 是 具有 0 个 或 更 多 参数 的 谓词 。 例 如 ，u(X) 是 具有 谓词 x 和 一 
个 参数 ( 这 里 的 参数 是 变量 X) 的 原子 公式 。 一 般 而 言 ， 参 数 要 么 是 变量 ， 要么 是 常量 。" 尽 管 
原则 上 讲 常量 的 值 可 以 是 任何 类 型 的 ， 但 我 们 通常 会 假设 这 些 值 是 整数 、 实 数 或 字符 串 。 

变量 是 那些 可 以 接受 任何 常量 作为 其 值 的 符号 。 我 们 不 应 该 把 “变量 ”与 第 12 章 “命题 变 
量 ” 中 的 “变量 ”和 弄 混 。 事 实 上 ,命题 变量 等 价 于 没有 参数 的 谓词 ， 而 且 我 们 会 把 表示 原子 公 
式 的 p 写 成 具有 谓词 名 p 和 0 个 参数 的 形式 。 

所 有 参数 都 是 常量 的 原子 公式 就 叫 作 基 本 原子 公式 ( ground atomic formula )。 非 基本 原子 
公式 (nonground atomic formula ) 可 以 用 常量 或 变量 作为 参数 ， 但 至 少 有 一 个 参数 一 定 是 变量 。 
请 注意 ， 作 为 没有 参数 的 原子 公式 ， 任 何 命题 的 “所 有 参数 都 是 常量 ”， 因 此 是 基本 原子 公式 。 

































































QD 谓词 逻辑 还 允许 参数 是 单个 变量 或 常量 之 外 的 更 复杂 的 表达 式 。 这 对 我 们 在 本 书 中 没有 讨论 到 的 某 些 用 途 来 说 
是 很 重要 的 。 因 此 ， 本 章 中 我 们 将 只 会 看 到 变量 和 常量 作为 谓词 的 参数 。 
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14.2.2 ”常量 和 变量 的 区 分 


我 们 要 使 用 以 下 约定 来 区 分 常 
方式 表示 的 : 

(1) 以 小 写字 母 开 头 的 字符 串 ; 

(2) 12 或 14.3 这 样 的 数字 ; 

(3) 带 引号 的 字符 串 。 
因此 ， 如 果 要 把 课程 CS101 表 示 为 常量 ， 就 可 以 将 其 写 为 “CS101”。” 

像 常 量 这 样 的 谓词 将 会 用 以 小 写字 母 开 头 的 字符 串 表 示 。 我 们 不 可 能 把 谓词 与 常量 弄 混 ， 
因为 常量 只 可 能 出 现在 原子 公式 的 参数 中 ， 而 谓词 是 不 可 能 出 现在 那里 的 。 


+ 示例 14.1 

我 们 可 以 用 谓词 名 csg 表示 8.2 节 讨论 过 的 “课程 -学 号 -成 绩 ” 关 系 中 所 含 的 信息 。 原 子 公 
式 csg(C,S,G) 可 以 被 视 作 在 说 : 对 变量 C、$ 和 CG， 学 号 为 8 的 学 生 选 修了 课程 C， 并 得 到 了 成 绩 
G。 换 句 话 说， 当 我 们 用 常量 c 代 替 C， 用 s 代 替 8S， 并 用 g 代 替 G 时 ， 当 且 仅 当 学 号 为 * 的 学 生 选 修 
了 课程 c 并 取得 成 绩 g，csg(c,s,h) 的 值 为 TRUE。 

还 可 以 通过 用 常量 作为 参数 ,把 关系 中 的 特定 事实 ( 即 元 组 ) 表示 为 基本 原子 公式 。 例如， 
图 8-1 中 第 一 个 元 组 可 以 表示 为 csg("CS101",12345,"A") ， 断 言 学 号 为 12345 的 学 生 CS101 课 程 的 
成 绩 是 A。 最 后 ， 可 以 在 参数 中 混用 常量 与 变量 ， 因 此 就 可 能 看 到 csg("CS101",S,G) 这 样 的 原 
子 公 式 。 如 果 变 量 S 和 G 的 取 值 (s,g) 满足 学 号 为 s 的 学 生 选 修了 课程 CS101 并 取得 成 绩 g， 则 该 原 
子 公 式 为 真 ， 否 则 就 为 假 。 


14.2.3 ”习题 


利用 本 节 中 的 约定 ， 确 定 以 下 内 容 是 常量 、 变 量 、 基 本 原子 公式 还 是 非 基 本 原子 公式 。 
(a) CS205 
(b) cs205 
(c) 205 
(d) “cs205” 
(e) PC 加 
(f) p(3, 4, 5) 
(g) “PpG3, 4, 5)" 


14.3 ”逻辑 表达 式 


第 12 章 中 为 命题 逻辑 使 用 过 的 概念 ( 文字、 逻辑 表达 式 、 子 句 等 ) 沿用 到 了 谓词 逻辑 中 。 
在 下 一 节 中 我 们 还 会 引入 两 种 额外 的 运算 符 来 构成 逻辑 表达 式 。 不 过 ， 人 逻辑 表 达 式 构造 背后 的 
基本 思路 在 命题 逻辑 和 谓词 逻辑 中 基本 是 相同 的 。 
14.3.1 文字 


文字 要 么 是 原子 公式 ， 要 么 是 原子 公式 的 否定 。 如 果 在 原子 公式 的 参数 中 没有 变量 ， 那 么 
相应 的 文字 就 是 基本 文字 ( ground literal )。 








ja 
EE 
\ 渡 
由 
六 
ja 
这 
EC 
并 
汪 
+ 
册 
尾 
必 
导 
* 
球 
类 
并 
酒 
注 
-| 
己 
骆 
























































J 常量 在 逻辑 中 通常 称 为 “原子 ”。 不 巧 的 是 ,“ 原 子 公 式 ”也 时 常 被 称 为 “原子 ”, 因此 一 般 会 避免 使 用 术语 “原子 ”。 
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+ 示例 14.2 

p(X,a) 是 原子 公式 并 且 是 文字 。 它 不 是 基本 的 , 因为 根据 我 们 的 决定 , 它 的 参数 ?是 变量 。 
NOT p(X,a) 是 文字 , 但 它 不 是 原子 公式 ， 也 不 是 基本 文字 。 表 达 式 p(a,b) 和 NOT p(a,b) 都 是 基 
本 文字 , 但 只 有 前 者 是 (基本 ) 原子 公式 。 

就 像 命 题 逻 辑 那 样 ， 可 以 用 上 横 线 代 蔡 NOT 运 算 符 。 不 过 ， 当 横 线 用 在 很 长 的 表达 式 上 时 ， 
就 会 容易 混淆 ， 因 此 与 第 12 章 相 比 ， 在 本 章 中 会 更 常见 到 NOT。 


14.3.2 ”逻辑 表达 式 


我 们 可 以 像 12.3 节 中 用 命题 变量 构建 表达 式 那 样 ， 用 原子 公式 构建 表达 式 。 这 里 将 继续 使 
用 第 12 章 中 讨论 过 的 AND、OR、NOT、 一 和 = 运算 符 ， 以 及 其 他 的 逻辑 连接 符 。 而 在 下 一 节 中 ， 
我 们 会 介绍 “量词 ”, 也 就 是 可 以 在 谓词 逻辑 中 用 来 构建 表达 式 , 但 在 命题 逻辑 中 没有 类 比 物 的 
运算 符 。 

就 像 横 线 是 NOT 的 简化 符号 那样 , 可 以 继续 用 并 置 ( 没有 运算 符 ) 来 表示 AND 并 用 + 表示 OR。 
不 过 ， 我 们 并 不 经 常 使 用 这 些 简化 符号 ， 因 为 它们 可 能 让 谓词 逻辑 中 较 长 的 表达 式 变 得 难以 
理解 。 

下 面 的 例子 应 该 能 让 大 家 对 刘 辑 表达 式 的 含义 有 所 领 居 。 不 过 ， 要 注意 到 这 里 的 讨论 对 其 
进行 了 非常 大 的 简化 ， 而 我 们 要 到 14.5 节 才 会 讨论 “解释 "， 以 及 它们 为 谓词 逻辑 中 的 逻辑 表达 
式 赋予 的 含义 。 


+ 示例 14.3 

假设 有 谓词 csg 和 snap , 它们 分 别 可 以 解释 为 第 8 草 中 介绍 过 的 “课程 -学 号 -成 绩 ” 与 “学 
号 -姓名 -地 址 -电话 ”这 两 个 关系 。 并 假设 我 们 想 要 找到 名 为 “C.Brown” 的 学 生 CS101 诬 程 的 
成 绩 。 就 可 以 断言 以 下 逻辑 表达 式 

(csg(“CS101",S,G)AND snap(S,"C.Brown”, A,P)) —> answer(G) (14.1) 
这 里 的 azswer 是 另 一 个 谓词 ， 如 果 C 是 某 个 名 为 “C.Brown ”的 学 生 CS101 诛 程 的 成 绩 ， 它 就 适 
用 于 成 绩 C。 

在 我 们 断言" 某 个 表达 式 时 ,就 说 明了 不 管用 什么 值 蔡 换 其 变量 ,该 表达 式 的 值 都 为 TRUE。 
粗略 地 讲 ，(14.1) 这 样 的 表达 式 可 以 按照 以 下 方式 解释 。 如 果 用 向 量 代 蔡 各 变量 ， 则 各 原子 公式 
束 成 了 基本 原子 公式 。 通 过 参考 “现实 世界 ”或 是 在 列 出 茶 给 定 谓 词 为 真 的 基本 原子 公式 的 天 
系 中 进行 查找 ， 可 以 确定 一 个 基本 原子 公式 是 真 还 是 假 。 在 用 0 或 1 代 符 各 个 基本 原子 公式 时 ， 
可 以 为 表达 式 本 身 求 值 ， 就 像 第 12 章 中 为 命题 逻辑 表达 式 求 值 那样 。 

在 表达 式 (14.1) 的 情况 中 ， 可 以 取 图 8-1 和 图 8-2a 中 的 元 组 为 真 。 特 别 要 说 的 是 ， 

csg("CS101",12345,"A") 

































































和 
snap(12345,"C.Brown”,’l2 Apple St.”,’555—1234") 
为 真 。 然 后 可 以 设 


S =12345 

G = “A 

4= 12 Apple St.” 
P=°“555—1234 
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这 让 (14.1) 的 左边 成 了 1 AND 1， 它 的 值 当然 是 1。 原 则 上 讲 ， 我 们 对 谓词 answer 没 有 任何 了 解 。 
不 过 ， 我 们 断言 了 (14.1)， 这 意味 着 不 管用 什么 值 蔡 代 其 中 的 变量 ， 它 的 值 都 是 TRUE。 因 为 它 
的 左边 根据 上 述 蔡 换 得 到 了 TRUE， 所 以 右边 不 可 能 为 FALSE。 因 此 我 们 推导 出 了 answer ("A") 
为 真 。 


14.3.3 ”其 他 术语 


我 们 还 会 使 用 其 他 与 命题 逻辑 相关 联 的 术语 。 一 般 来 说 ， 当 本 章 中 讲 到 命题 变量 时 ， 说 的 
就 是 所 有 原子 公式 ， 其 中 包括 不 含 参数 的 谓词 〈 即 命题 变量 ) 作为 特例 。 例 如 ， 子 句 是 一 组 由 
OR 运 算 符 连 接 的 文字 。 同 样 ， 如 果 表 达 式 是 子 句 的 AND， 那 么 就 说 它 是 合 取 范式 。 如 果 表 达 式 
是 多 个 项 的 OR， 而 这 些 项 各 自 是 文字 的 AND， 那 么 这 样 的 表达 式 就 是 析 取 范式 。 


14.3.4 习题 


(1) 为 问题 “L. Van Pelt 的 PH100 课 程 取 得 了 什么 成 绩 ? ” 写 出 类 似 (14.1) 的 表达 式 。 假 设 事 实 如 网 8-1 
和 图 8-2 所 示 ， 其 参数 有 什么 值 时 能 让 answer 显 然 为 真 ? 为 展现 该 答案 的 真实 性 ， 对 变量 进行 了 怎 
样 的 替换 ? 

(2) 设 cdh 是 代表 图 8-2c 中 “课程 ~- 日子- 时 刻 ” 关 系 的 谓词 ， 而 cr 则 是 对 应 图 8-2d 中 “课程 -教室 ” 
关系 的 谓词 。 为 问题 “C.Brown 星 期 一 上 午 9 点 在 哪里 ? ” (更 精确 地 讲 ， 是 “C.Brown 选 修 的 
星期 一 上 午 9 点 上 课 的 课程 在 哪个 教室 上 课 ? ”) 写 出 类 似 (14.1) 的 表达 式 。 假 设 事实 如 图 8-1 和 
图 8-2 所 示 ， 其 参数 有 什么 值 时 能 让 answer 显 然 为 真 ” 为 展现 该 答案 的 真实 性 ,对 变量 进行 了 怎 
样 的 蔡 换 ? 

(3) ** 8.7 节 中 讨论 过 的 各 种 关系 代数 运算 可 以 用 类 似 (14.1) 的 表达 式 在 谓词 敢 辑 中 表示 出 来 。 例 如 ， 
(14.1) 本 身 就 等 价 于 关系 代数 表达 式 

克 成 绩 ( 0 课程 "CS101"AND 姓名 "C.Brown"(CSG Pr4 SNAP)) 
说 明 选 择 、 投 影 、 联 接 、 并 、 交 、 差 这 些 运 算 用 谓词 逻辑 中 “表达 式 蕴 含 答案 ”的 形式 表示 出 来 
是 什么 样子 ， 然 后 将 8.7 节 的 示例 中 给 出 的 各 关系 代数 表达 式 转 化 成 逻辑 表达 式 。 
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我 们 回 到 涉及 无 参数 谓词 x-(“ 天 在 下 雨 ”), 以 及 单 参 数 谓词 (XX)(“X 带 着 使 ”) 和 w(X)(“X 

被 淋 湿 ”) 的 例子 。 你 可 能 希望 断言 “如 果 下 雨 ， 那 么 某 人 会 淋 湿 ”。 也 许 会 尝试 
r 一 W(“ 乔 仍 ”)OR w(“ 莎 莉 ”) OR w(“ 苏 ”) OR w(“ 山 姆 ”)oR… 

但 这 一 尝试 会 以 失败 告终 ， 原 因 如 下 。 

(1) 可 以 把 表达 式 写 成 有 限 个 表达 式 的 OR， 但 不 能 把 它 写成 无 限 个 表达 式 的 OR; 

(2) 不 知道 所 谈论 个 体 的 完全 集 。 

要 表示 一 批 通过 为 某 个 变量 替换 所 有 可 能 的 值 形成 的 表达 式 的 OR， 就 需要 一 种 额外 的 方式 
来 创建 谓词 逻辑 表达 式 。 这 一 运算 符 是 3 ， 读 作 “ 存 在 ”。 我 们 将 其 用 在 (3X)w(X) 这 样 的 表达 
式 中 , 或 者 粗略 地 将 其 表述 为 “存在 某 一 个 体 X， 满足 8 被 淋 湿 ”。 一 般 而 言 ， 如 果 有 是 任何 逻辑 
表达 式 , 那么 (43X)(E) 也 是 逻辑 表达 式 。" 其 大 概 的 含义 为 ， 至 少 存在 一 个 X 的 值 使 得 E 为 真 。 更 

















J 表达 式 E 两 边 的 括号 有 时 是 必要 的 ,， 有 时 是 不 必要 的 , 这 取决 于 该 表达 式 的 具体 内 容 。 当 我 们 在 本 节 稍 后 的 内 容 
中 讨论 优先 级 和 结合 性 时 ， 情 况 就 会 变 得 更 清楚 了 。 3X 周围 的 括号 是 该 符号 的 一 部 分 ， 因 此 总 是 必需 的 。 
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精确 地 讲 ， 对 E 中 其 他 变量 的 各 种 取 值 来 说 ， 可 以 找 出 某 个 X 的 值 (在 所 有 情况 中 并 不 一 定 是 同 
样 的 值 ) 使 得 E 为 真 。 

同样 ， 我 们 不 能 写 出 下 面 这 样 的 无 限 个 表达 式 的 AND。 

U(“ 乔 伊 ”)aANDU(“ 落 和 莉 ”) ANDu (“ 苏 ”) AND wu (“山姆 ”)… 

要 构造 一 系列 通过 为 某 给 定 变 量 蔡 换 所 有 可 能 的 值 形 成 的 表达 式 的 AND， 需 要 符 写 Vv ( 称 
为 “对 所 有 的 ”)。 例 如 ，(vX)u( 了 ) 就 表示 “对 所 有 的 XX，X 部 带 着 爹 ”"。 一 般 而 言 ， 对 任何 逻辑 
表达 式 E，(vVX)(E) 意味 着 ， 对 有 中 其 他 变量 所 有 可 能 的 取 值 来 说 ， 用 来 替换 ZX 每 个 常量 都 能 
使 有 为 真 。 

符号 Y 和 就 叫 作 量词 。 有 时 候 也 会 把 v 叫 作 全 称 量词 (universal quantifier )， 把 习 叫 作 存 
在 量词 ( existential quantifier )。 





























+ 示例 14.4 

表达 式 r 忆 (VX)(u(X)oR w(X)) 意味 着 “如 果 下 雨 ， 那 么 对 所 有 的 个 体 X， 要 么 X 带 着 例 ， 
要 么 X 被 淋 湿 ”"。 请 注意 ， 量 词 可 以 应 用 于 任意 表达 式 ， 而 不 只 是 前 面 所 述 例 子 中 的 原子 公式 。 

再 举 个 例子 ， 可 以 把 表达 式 

(YO)(((3S)csg(C,X,"A")) > (37)csg(C,7,"B"))) (14.2) 

解释 为 ,“ 对 所 有 的 课程 C， 如 果 存 在 学 号 为 8 的 学 生 该 课程 的 成 绩 为 A， 那 么 一 定 存在 学 号 为 了 
的 学 后 该 课程 的 成 绩 为 B”。 不 那么 严谨 地 讲 就 是 “如 果 给 了 A， 那 么 也 必须 给 B”。 

第 三 个 示例 表达 式 是 








((vYX)NOT w(X))oR((37)w(Y)) (14.3) 

粗略 地 讲 就 是 ,“ 要 么 所 有 个 体 X 痢 不 被 淋 湿 , 要 么 至 少 有 一 个 个 体 7 被 淋 湿 ”。 表达 式 (14.3) 与 本 
示例 中 的 其 他 两 个 表达 式 是 不 同 的 ， 因 为 这 个 表达 式 是 重 言 式 一 一 也 就 是 说 ， 不 管 谓 词 w 的 含 
义 是 什么 ， 该 表达 式 都 为 真 。(14.3) 的 真实 性 与 “雨天 ”的 属性 没有 任何 关系 。 不 管 使 谓词 w 为 
真 的 值 构成 的 集合 S 是 什么 ， 要 么 为 空 ( 即 对 所 有 X，w(Z) 都 为 假 )， 要 么 S 不 为 空 (也 就 是 ， 
存在 某 个 7 使 得 w(7) 为 真 )。 
14.4.1 ”逻辑 表达 式 的 递归 定义 

作为 回顾 ， 我 们 要 给 出 谓词 逻辑 中 这 类 逻辑 表达 式 的 递归 定义 。 

依据 。 每 个 原子 公式 都 是 表达 式 。 

归纳 。 如 果 E 和 是 逻辑 表达 式 ， 那 么 以 下 表达 式 也 是 逻辑 表达 式 。 

(1) NOTE、EANDF、EORF、E->F 和 E=F。 粗 略 地 讲 ， 我 们 也 允许 使 用 NAND 这 样 的 
其 他 命题 逻辑 运算 符 。 

(2) 对 任何 变量 X，(3X)E 和 (VX)E。 原则 上 讲 , Xx 甚至 不 需要 在 E 中 出 现 , 虽然 实践 中 这 样 
的 表达 式 很 难 “说 得 通 ”。 
14.4.2 ”运算 符 的 优先 级 

般 而 言 ， 需 要 在 所 有 用 到 表达 式 E 和 的 地 方 为 其 加 上 括号 。 不 过 ， 就 像 我 们 已 经 看 到 的 
其 他 代数 那样 ， 通 常 可 以 出 于 运算 符 优先 级 的 原因 删 掉 一 些 括号 。 这 里 要 继续 使 用 12.4 市 定义 
的 运算 符 优 先 级 ，NOT (最 高 )、AND、OR、 一 和 = (最 低 )。 不过， 量词 在 所 有 运算 符 中 有 着 
最 高 的 优先 级 。 
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+ 示例 14.5 
(3X)p(X)OR q(X) 会 被 分 组 为 
((3X)p(X))OR gq(X) 
同样 ， 表 达 式 (14.3) 中 外 层 那 两 对 括号 是 多 余 的 ， 所 以 可 以 将 其 写 为 
(VX)NOT w(X)OR (3X)w(Y) 
还 可 以 消除 (14.2) 中 的 两 对 括号 ， 并 将 其 写 为 
(vO)((3S)csg(C,S,"A") > (3T)csg(C,T,"B")) 
(VC) 后 整个 表达 式 两 侧 的 括号 是 必要 的 ， 这 样 才 能 把 “对 所 有 的 C” 应 用 到 整个 表达 式 上 。 





量词 的 次 序 
混 消 量词 的 次 序 是 个 常见 的 逻辑 错误 ， 例 如 ， 有 人 可 能 误 认为 (YY) (37) 与 (43X) (VD 女人 多 
义 相 同 ， 但 它们 是 不 同 的 。 例 如 ， 如 果 粗 略 地 把 /oves(X, 站 ) 解释 为 “XX 爱 Y”， 那 么 
(YX)(3Y)loves(X,7) 就 表示 “每 个 人 都 爱 菜 个 人 ”， 也 就 是 说 ， 对 每 个 个 体 X， 至 少 存在 一 个 
个 体 了 是 了 所 爱 的 。 另 一 方面 (37)(VX)loves( 怀 ,7 了 ) 则 表示 ， 存 在 某 个 被 每 个 人 所 爱 的 个 体 关 一 
这 是 个 非常 幸运 的 了 ， 如 果 存 在 这 样 的 人 的 话 。 





请 注意 ， 量 词 (VX) 和 (3X) 所 带 的 括号 并 不 是 用 于 分 组 的 ， 它 们 应 该 被 看 作 表示 量词 的 符 
号 的 一 部 分 。 还 有 ， 请 记 住 量词 和 NoOT 都 是 一 元 的 前 级 运算 符 ， 而 且 唯 一 明智 的 分 组 方式 就 是 
从 右边 起 为 它们 分 组 。 


+ 示例 14.6 
此 表达 式 (YX) NOT (37)p(X,7) 被 分 组 为 


(VX)(NOT((37)p(X,7))) 


并 表示 “对 所 有 的 XY， 都 不 存在 7 使 得 p(X,7) 为 真 "。 换 句 话 说 束 是 ， 不 存在 使 得 p(X,7) 为 真 
的 X 和 7 的 取 值 对 。 


14.4.3 ”约束 变量 和 自由 变量 


量词 与 表达 式 中 的 变量 相互 作用 的 方式 是 很 微妙 的 。 要 解决 这 一 问题 , 首先 要 想到 Ci 语言 
中 局 部 变量 和 全 局 变量 的 概念 。 假 设 如 图 14-1 所 示 ，X 被 定义 为 C 语 言 程序 中 的 外 部 变量 。 假 
设 X 不 是 在 main 函 数 中 声明 的 ， 那么 main 函 数 中 对 X 的 引用 就 是 对 外 部 变量 的 引用 。 男 一 方 
面 ， 函 数 E 中 也 声明 了 局 部 ( 自动 控制 ) 变量 X， 而 函数 E 中 对 XY 的 所 有 引用 都 是 对 该 局 部 变量 
的 引用 。 

C 语 言 程序 中 对 X 的 声明 与 量词 (VX) 或 (3X) 存 在 着 很 近 的 相似 性 。 如 果 有 表达 式 (VX)E 或 
(3X)E ,那么 该 量词 就 相当 于 为 表达 式 E 声 明了 局 部 的 X， 就 像 E 是 函数 ,而 X 被 声明 为 该 也 数 的 

“应 




















局 部 变量 那样 。 
在 接 下 来 的 内 容 中 ， 有 必要 用 符号 O 来 表示 任 一 量词 。 具 体 来 说 就 是 ， 用 (OX) 代表 “应 用 
于 X 的 某 个 量词 "， 也 就 是 (YX) 或 (4X)。 
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图 14-1 局 部 变量 和 全 局 变量 
如 果 E 具 有 某 个 形 如 (OX)F 的 子 表 达 式 ， 那 么 该 子 表达 式 就 像 是 E 中 声明 的 程序 块 ， 而 E 在 
自身 对 XX 进行 了 声明 。 在 F 中 对 X 的 引用 就 引用 了 由 这 一 (OQX) “声明 的 ”XX， 而 E 中 了 之 外 的 部 分 
所 使 用 的 了 引用 了 X 的 其 他 声明 一 一 要 么 是 与 5 相关 联 的 量词 , 要 么 是 与 包含 在 ZE 中 但 限制 了 所 
考虑 的 X 的 某 个 表达 式 相 关联 的 量词 。 





OR 


图 14-2” 对 应 (YX)u( 耻 ) OR (YX)w( 了 了 ) 表达 式 树 


+ 示例 14.7 

考虑 表达 式 

(VZ)xz(CZ)OR(CYZ)w(T ) (14.4) 

粗略 地 讲 ， 该 表达 式 的 含义 是 “要 么 每 个 人 都 带 着 伞 ， 要 么 每 个 人 都 被 淋 湿 ”。 我 们 可 能 不 相信 
这 一 命题 的 真实 性 ， 但 这 里 要 拿 它 来 当 例子 考虑 。 表 达 式 (14.4) 的 表达 式 树 如 图 14-2 所 示 。 请 注 
意 ， 第 一 个 量词 (YXZ) 只 在 它 的 子孙 u 中 使 用 X, 而 第 二 个 量词 (VX) 只 在 它 的 子孙 w 中 使 用 X。 要 
区 分 所 使 用 的 是 在 哪个 量词 中 “声明 ”的 ， 就 只 能 从 该 X 向 上 追溯 ， 直 到 遇 到 量词 (OX) 为 止 。 
因此 这 里 所 使 用 的 两 个 码 | 用 了 不 同 的 “声明 ”， 而 且 它 们 之 间 没 有 任何 关系 。 

要 注意 可 以 为 (14.4) 中 X 的 两 个 “声明 ”使 用 不 同 变 量 ,将 其 写作 (VX)u(X) OR (V7)w(Y)。 
一 般 来 说 , 总 是 可 以 为 谓词 逻辑 表达 式 的 变量 重 命名 , 从 而 使 同一 变量 不 会 出 现在 两 个 量词 中 。 
这 种 情况 与 C 语 言 这 样 的 编程 语言 是 类 似 的 ， 我 们 在 编程 语言 中 会 为 程序 中 的 变量 重 命名 ， 这 
样 相同 的 变量 名 就 不 会 使 用 在 两 个 声明 中 。 例 如 ， 在 图 14-1 中 ， 可 以 把 函数 f 中 变量 名 x 的 所 有 
实例 都 变 为 任何 新 变量 名 Y。 


+ 示例 14.8 
再 举 个 例子 ， 考 虑 表达 式 




















(VX)(u(X) oR IX)W(X)) 
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粗略 地 讲 ， 其 含义 是 “对 各 个 体 ， 要 人 么 该 个 体 带 着 例 ， 要么 存在 茶 一 ( 可 能 是 男 一 ) 个 体 被 淋 
湿 ” 该 表达 式 的 表达 式 树 如 图 14-3 所 示 。 请 注意 , w 中 使 用 的 X 指 的 是 X 限 定 了 私密 性 的 “声明 ”， 
也 就 是 存在 量词 。 换 句 话 说 , 如 果 从 w(X) 沿 着 树 向 上 行进 , 那么 在 遇 到 全 称 量词 之 前 会 遇 到 存 
在 量词 。 不 过 ，zx 中 所 使 用 的 X 就 不 在 该 存在 量词 的 “范围 ”内 。 如 果 从 w(CZ) 上 行 ， 首 先 会 遇 
到 全 称 量词 。 可 以 把 该 表达 式 写 为 














(VX)(u(X) oR GY)wY)) 
这 样 就 没有 哪个 变量 会 出 现在 两 个 量词 中 了 。 
(YX ) 
OR 
u(X) (3X) 
w(X) 


图 14-3 ”对 应 (VX)(u(X) OR (3X)w(X)) 的 表达 式 树 














如 有 果 在 逻辑 表达 式 E 的 表达 式 树 中 ， 涉 及 某 个 变量 X 的 量词 是 该 X 的 最 低 祖先 ， 就 可 以 说 该 
变量 X 是 受 量词 O(X) 约束 的 。 如果 某 个 X 不 受 任何 量词 约束 ,那么 该 X 就 是 自由 变量 。 因此 量词 
就 像 是 以 该 量词 为 根 方 点 的 子 树 7 局 部 的 “声明 ”。 这 些 量词 会 应 用 到 7 中 除了 以 具有 同样 变量 
的 男 一 个 量词 为 根 节 点 的 子 树 之 外 的 各 个 节点 。 而 自由 变量 就 像 是 全 局 变量 之 于 菏 一 函数 那样 ， 
它们 的 “声明 ”是 在 所 考虑 的 表达 式 之 外 进行 的 。 


+ 示例 14.9 
考虑 表达 式 














u(X) OR(IX)Ww(X) 

也 就 是 说 , “要么 X 带 着 例 , 要 么 有 某 个 人 会 被 淋 湿 ”。 相 应 的 表达 式 树 如 图 14-4 所 示 。 正 如 之 前 
的 例子 中 那样 ,这 里 出 现 的 两 个 指 的 是 不 同 个 体 。w 中 出 现 的 是 受到 存在 量词 约束 的 。 不过， 
在 u 中 出 现 的 Xx 之 上 没有 对 应 X 的 量词 ， 因此 这 次 出 现 的 X 在 给 定 的 表达 式 中 是 自由 变量 。 这 个 例 
子 说 明 ， 在 某 表 达 式 中 同一 变量 可 能 同时 作为 自由 变量 和 作为 约束 变量 出 现 ， 所 以 在 某 些 情况 
下 ， 我 们 会 说 “作为 约束 变量 出 现 ” 而 不 是 直接 说 “约束 变量 ”"。 示 例 14.7 和 14.8 中 的 表达 式 表 
明 ， 出 现在 不 同位 置 的 相同 变量 ， 也 可 能 分 别 受到 出 现在 不 同位 置 的 相同 量词 的 约束 。 

OR 














u(X) (3X) 


图 14-4 ”对 应 u(X) OR (3X)w(X) 的 表达 式 树 





14.4.4 习题 


(1) 从 以 下 表达 式 中 删除 多 余 的 括号 。 
(a) (YX)((37) (NoT (p(X)OR (POAND q(x))))) 


(b) GX)((NOT p(X)) AND(G3Y)(p(7))oOR(3X)(g(X,2)))) 

(2) 为 习题 (1) 中 的 表达 式 画 出 表达 式 树 。 如 果 出 现 的 变量 是 受 量 词 约束 的 ， 则 指出 它 是 受 哪 个 量词 约 
束 的 。 

(3) 重 写 习 题 (1) 中 的 表达 式 (b)， 使 得 其 中 的 量词 不 合 相 同 的 变量 。 

(4) * 在 前 文 附注 栏 “ 量 词 的 次 序 ” 中 ， 我 们 谈论 了 量词 loves(X,7) ， 并 为 其 给 出 了 预料 之 中 的 粗略 
解释 。 不 过 ， 正 如 我 们 将 在 14.5 节 中 看 到 的 ， 谓 词 没 有 具体 的 解释 ， 而 且 也 可 以 拿 loves 来 谈论 整 
数 而 非 个 人 ， 并 为 loves(X,Y) 给 出 了 上 = 和 +1 这 样 的 粗略 解释 。 在 这 种 解释 下 ， 比 较 
(YX)(37)loves(X,7) 和 (37)(VX)loves( 外 ,7 了 ) 的 含义 。 它 们 的 粗略 解释 各 是 什么 ”如 果 可 能 的 
话 ， 大 家 会 相信 哪个 ? 

(5)* 利用 之 前 例子 中 的 谓词 csg， 写 出 断言 以 下 内 容 的 表达 式 。 

(a) C.Brown 是 个 A 等 生 ( 即 他 所 有 课程 的 成 绩 都 是 A ) 。 
(b) C.Brown 不 是 A 等 生 。 

(6) * 设计 文法 ， 描 述 合法 的 谓词 逻辑 表达 式 。 大 家 可 以 使 用 常量 和 变量 这 样 具有 象征 性 的 终结 符 ， 

而 且 不 需要 考虑 重复 括号 的 问题 。 














14.5 解释 





直到 现在 ， 我 们 对 谓词 逻辑 表达 式 有 何 “含义 ”， 或 者 说 是 对 如 何 为 表达 式 赋 了 予 含义 的 了 解 
还 是 相当 模糊 。 这 里 要 通过 先 回 顾 命 题 逻 辑 表 达 式 E 的 “含义 ”来 阐释 这 一 主题 。 命 题 逻 辑 表 达 
式 的 含义 是 接受 “ 真 值 赋 值 ”( 为 E 中 的 命题 变量 指定 真 值 0 和 1 的 情况 ) 作为 参数 , 并 产生 0 或 1 作 
为 结果 的 函数 。 根 据 给 定 的 真 值 赋值 ， 用 0 或 1 蔡 代 表达 式 E 中 的 各 原子 操作 数 ， 并 求 出 E 的 值 ， 从 
而 确定 结果 。 换 句 话说 , 人 逻辑 表达 式 E 的 含义 就 是 为 各 组 真 值 赋值 给 出 相应 2 值 ( 0 或 1 ) 的 真 值 表 。 

而 真 值 赋值 是 接受 命题 变量 作为 参数 ， 并 为 各 参数 返回 0 或 1 的 函数 。 换 名 话说， 可 以 把 真 
值 赋值 视 为 给 各 命题 变量 给 定 某 一 真 值 ( 0 或 1 ) 的 表格 。 图 14-5 展 示 了 这 两 种 函数 的 角色 。 














真 值 赋值 0 或 1 
(a) 真 值 赋值 是 从 谓词 到 真 值 的 函数 
含义 


真 值 赋值 一 一 一 一 一 2 (0 或 1 
(b) 表达 式 的 含义 是 从 真 值 赋值 到 真 值 的 函数 
图 14-5 ”命题 逻辑 中 表达 式 的 含义 
在 谓词 逻辑 中 ， 为 谓词 指定 常数 0 或 1 ( TRUE 或 FALSE ) 是 不 够 的 ， 除 非 谓 词 不 含 参数 ， 而 
这 种 情况 下 它们 从 本 质 上 讲 就 是 命题 变量 。 不 过 ， 为 谓词 赋 的 值 本 身 是 歌 吸 数 ， 它 接受 谓词 参 
数 的 值 作为 输入 ， 并 产生 0 或 1 作为 输出 。 
更 加 精确 地 讲 ， 首 先 必须 从 变量 可 能 的 取 值 中 选取 一 些 值 构成 非 空 的 定义 域 D。 这 一 定义 
域 可 以 是 任何 内 容 : 整数 、 实 数 ， 或 由 没有 特殊 名 称 或 意义 的 值 构成 的 某 个 集合 。 不 过 ,假设 
定义 域 含有 出 现在 表达 式 本 映 中 的 所 有 常量 。 
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现在 , 设 p 是 具有 Kk 个 参数 的 谓词 。 那么 谓词 p 的 解释 就 是 接受 定义 域 元 素 到 p 中 k 个 参数 的 赋 
值 作 为 输入 ， 并 返回 0 或 1 (TRUE 或 FALSE ) 的 函数 。 或 者 说 ， 可 以 把 p 的 解释 看 作 具 有 Kk 列 的 关 
系 。 对 让 pz 在 该 解释 中 为 真 的 各 参数 赋值 来 说 ， 在 该 关系 中 都 存在 相应 的 元 组 。” 

现在 可 以 把 表达 式 E 的 解释 定义 为 : 

(1) 非 空 的 定义 域 D， 含有 E 中 出 现 的 任何 常量 ， 

(2) 对 E 中 出 现 的 各 谓词 bp 的 解释 ， 以 及 

(3) DP 中 对 应 表达 式 E 各 自由 变量 的 值 ( 如 果 存 在 自由 变量 的 话 )。 

解释 与 “对 谓词 的 解释 ”分 别 如 图 14-6a 和 图 14-6b 所 示 。 请 注意 ,解释 在 谓词 逻辑 中 的 角 
色 就 相当 于 真 值 赋值 在 命题 逻辑 中 的 作用 。 




















参数 的 值 谓词 的 解释 0 或 1 


(a) 谓词 的 解释 为 参数 值 元 组 指定 了 真 值 


解释 谓词 p 的 解释 
Xx 解释 变量 X 的 值 


(b) 解释 为 各 谓词 指定 了 谓词 解释 ， 并 
为 各 变量 指定 了 值 (类 似 真 值 赋 值 ) 





解释 含义 0 或 1 


(c) 表达 式 的 含义 为 各 解释 指定 真 值 (类 似 真 值 表 ) 
图 14-6 “谓词 逻辑 中 表达 式 的 含义 


+ 示例 14.10 
考虑 以 下 谓词 逻辑 表达 式 : 





p(X,7) > (32)(p(X,2) AND p(2,7)) (14.5) 
谓词 p 一 种 可 能 的 解释 ( 我 们 将 称 其 为 解释 I ) 如 下 所 述 。 


(1) 定义 域 D 是 实数 集 。 
(2) 只 要 UV ，p(U,V) 就 为 真 。 也 就 是 说 , p 的 解释 是 有 序 对 (U,V) 的 无 限 集 构成 的 关系 ， 
其 中 满足 和 7 各 是 实数 而 且 愉 小 于 天 











(D 与 第 8 章 中 谈论 的 关系 不 同 ， 作 为 谓词 解释 的 关系 可 能 具有 无 限 多 的 元 组 。 
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那么 (14.5) 就 表示 ， 对 任何 实数 X 和 7， 如 果 X< 了 ， 则 存在 某 个 2 严格 位 于 XY 和 7 之 间 ， 也 就 
是 说 , 有 X<Z<7 。 对 解释 了 而 言 , (14.5) 总 是 为 真 。 如果 X< 了 了, 就 可 以 选择 Z=(X+ 妆 /2 ， 
也 就 是 X 和 7 的 平均 数 ， 然 后 就 能 确定 XY<Z 上 且 Z< 了 。 如 果 成 兰 7 ， 那 么 该 蕴涵 式 的 左边 为 假 ， 
则 (14.5) 显 然 为 真 。 

我 们 可 以 根据 谓词 p 的 解释 I ， 通 过 选择 任何 实数 作为 自由 变量 Y 和 7， 为 (14.5) 构 建 无 数 的 
解释 。 根 据 我 们 刚才 所 说 的 ， 这 些 对 应 (14.5) 的 解释 都 能 使 (14.5) 为 真 。 

谓词 p 第 二 种 可 能 的 解释 了 如 下 : 

(1) DD 是 整数 集 ; 

(2) 当 且 仅 当 U<V 时 ，p(U,W) 为 真 。 
现在 ， 我 们 可 以 声明 (14.5) 为 真 ， 除 非 了 = 了 对 +1。 因 为 如 果 Y 比 XY 大 2 或 者 更 多 ， 那 么 Z 就 可 以 被 
选 为 +1。 这 样 就 是 满足 <=<Z<Y 的 情况 。 如 果 针 三 7 ， 那 么 p(X,7) 为 假 ， 则 (14.5) 还 是 为 
真 。 不 过 ， 如 果 了 = 对 +1， 那么 p(X,7) 为 真 ,但 不 存在 严格 处 于 X 和 7Y 之 间 的 整数 Z。 因 此 这 种 
情况 下 对 每 个 整数 Z 而 言 ，p(X,Z) 和 p(Z,7) 都 为 假 ， 则 蕴涵 式 的 右边 ， 即 
(32)(p(X,2Z)AND p(Z,7)) 不 为 真 。 

通过 为 自由 变量 YX 和 7 冉 整 数值 ， 可 以 将 五 扩展 为 表达 式 (14.5) 的 解释 。 以 上 分 析 说 明了 ， 
除了 了 = 成 +1 情 况 下 外 ，(14.5) 对 任何 这 样 的 解释 都 为 真 。 

对 p 的 第 三 种 解释 工 是 抽象 的 ， 不 像 之 前 的 解释 I 和 7 那样 具有 常见 的 数学 含义 。 

(1) DD 是 三 个 符号 a、b、c 的 集合 。 

(2) 如 果 UV 是 aa、ab、ba、bc、cb、cc 其 中 之 一 ， 则 p(U, 中 为 真 ， 辱 UV 为 ac、bb 和 ca， 则 
p(U,V) 为 假 。 那 么 刚好 有 (14.5) 对 9 对 XY 都 为 真 。 在 每 种 情况 下 ， 要么 p(X,7) 为 假 ， 要么 存在 
Z 使 得 (14.5) 的 右边 为 真 。 图 14-7 列 举 了 这 9 种 情况 。 通 过 为 自由 变量 X 和 7 指定 由 a、b、c 构 成 的 
任意 赋值 组 合 ， 我 们 有 9 种 方式 可 以 把 工 扩 展 为 (14.5) 的 解释 。 














和 为 何 为 真 
a a Z=a 或 b 
a b Z=a 
a C p(a,c) 为 假 
a Z=a 
b b p(c,a) 为 假 
C Z=c 
c a p(2b,D) 为 假 
C b Z=c 

C Z =b 或 c 








14.5.1 表达 式 的 含义 


回想 一 下 ， 命 题 收 辑 中 表达 式 的 含义 就 是 从 真 值 赋值 到 真 值 0 和 1 的 函数 ， 如 图 14-5b 所 示 。 
也 就 是 说 ， 真 值 赋 值 陈述 了 与 表达 式 原子 操作 数 的 值 有 关 的 所 有 信息 ， 然 后 为 该 表达 式 求 值得 
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到 0 或 1。 同 样 ， 在 谓词 逻辑 中 ， 表 达 式 的 含义 是 接受 解释 (我们 需要 利用 该 解释 为 原子 操作 数 
求 值 )， 并 返回 0 或 1 的 函数 。 表 达 式 含义 的 这 一 概念 如 图 14.6c 所 示 。 


+ 示例 14.11 

考虑 示例 14.10 中 的 表达 式 (14.5)。(14.5) 中 的 自由 变量 是 XY。 如 果 给 定 的 是 示例 14.10 中 对 
Pp 的 解释 I (p 是 针对 实数 的 < )， 而 且 给 定 了 值 X= 3.14 和 Y= 3.5， 那 么 (14.5) 的 值 就 是 1。 其 实 ， 
正如 我 们 在 示例 14.10 中 讨论 过 的 ， 有 着 对 p 的 解释 I ,任何 X 和 7 的 值 都 使 该 表达 式 的 值 是 1。 同 
样 的 结论 也 适用 于 对 p 的 解释 I ， 从 定义 域 {fa，b，c} 中 选取 的 任何 X 和 7 的 值 都 会 让 (14.5) 的 
值 为 1。 

另 一 方面 ， 如 果 给 定 了 解释 石 〈z 是 针对 整数 的 < )， 以 及 值 生 3 和 无 4， 那么 就 像 我 们 在 示 
例 14.10 中 讨论 过 的 ，(14.5) 的 值 是 0。 如 果 有 人 解释 I, ， 而 且 自 由 变量 的 值 分 别 是 咎 3 和 瑟 5， 那 
么 (14.5) 的 值 是 1。 

要 完成 对 表达 式 “ 含 义 ” 的 定义 ， 必 须 正式 地 定义 如 何 把 原子 操作 数 的 指针 转化 成 整个 表 
达 式 的 真 值 。 之 前 我 们 已 经 利用 直觉 ， 根 据 的 是 对 命题 逻辑 的 逻辑 连接 符 作 用 方式 的 理解 ， 以 
及 考虑 量词 的 直觉 。 给 定 某 解释 7 以 及 定义 域 D， 表 达 式 的 值 的 正式 定义 就 是 对 给 定 的 表达 式 媚 
的 表达 式 树 进行 的 结构 归纳 。 

依据 。 如 果 表 达 式 树 是 单个 叶子 节点 ， 那 么 E 是 原子 公式 p(X ,…, 久 ,) 。 这 些 蕊 全 都 要 侵 
是 和 常量、 要么 是 表达 式 E 的 自由 变量 。 解释 /为 各 变量 给 定 了 值 ， 这 样 一 来 就 拥有 了 p 所 有 参数 的 
值 。 同 样 ，/ 表 明了 在 以 这 些 值 作为 参数 的 情况 下 p 是 真 还 是 假 。 而 该 真 值 就 是 表达 式 E 的 值 。 

归纳 。 现 在 ， 必 须 假设 给 定 的 表达 式 E 对 应 的 表达 式 树 根 节 点 位 置 是 运算 符 。 这 存在 若干 
种 情况 ， 具 体 取决 于 E 的 根 节点 位 置 是 什么 运算 符 。 

首先 , 考虑 一 下 E 形 如 EANDE, 的 情况 , 也 就 是 说 , 根 节点 处 的 运算 符 是 AND。 归 纳 假设 可 
以 应 用 于 子 表达 式 和 EE,。 因 此 可 以 在 解释 [之 下 为 E 求 值 。" 同 样 ， 可 以 在 解释 /之 下 为 5, 求 
值 。 如 果 求 出 的 值 都 是 1， 那 么 E 的 值 就 是 1， 否 则 E 的 值 是 0。 

像 OR 或 NOT 这 样 的 其 他 逻辑 运算 符 的 归纳 也 是 如 法 炮制 。 对 OR 而 言 ， 我 们 会 为 两 个 子 表达 
式 求 值 ， 并 且 只 要 有 任何 一 个 子 表达 式 得 出 值 1， 就 为 表达 式 得 出 值 1。 而 对 NOT 来 说 ， 我 们 会 
为 那 一 个 子 表达 式 求 值 ， 并 得 出 该 表达 式 的 值 的 否定 ， 而 对 其 他 命题 逻辑 运算 符 来 讲 ， 人 处 理 方 
法 也 都 是 一 样 的 。 

现在 假设 E 形 如 (3X)E。 根 节点 运算 符 就 是 该 存在 量词 , 而且 我 们 可 以 将 归纳 假设 应 用 于 子 
表达 式 5 。 中 的 谓词 都 出 现在 E 中 ,而 5 中 的 自由 变量 都 是 E 的 自由 变量 , 可 能 还 要 加 上 X。” 
因此 , 我 们 可 以 为 定义 域 D 中 的 各 个 值 y 构 建 对 应 的 解释 1, 以 及 我 们 称 之 为 解释 的 对 变量 X 
的 赋值 v。 对 各 个 值 "， 我 们 会 问 ， 在 解释 J 之 下 马 是 否 为 真 。 如 果 至 少 存在 一 个 这 样 的 值 y， 
那么 我 们 说 = (3X)E 为 真 ， 否 则 就 说 FE 为 假 。 

最 后 ， 假 设 E 形 如 (VX)E 。 归 纳 假设 还 是 适用 于 EE 。 现 在 要 问 ， 对 定义 域 D 中 的 每 个 值 y， 
在 解释 J 之 下 是否 为 真 。 如 果 是 ， 就 说 E 的 值 是 1， 如 果 不 是 ，E 的 值 就 是 0。 






























































QD 严格 地 讲 ， 要 从 7 中 除去 那些 只 出 现在 E 中 但 没有 出 现在 Ei 中 的 对 应 谓词 p 的 解释 。 还 有 ， 必 须 放弃 那些 出 现在 EZ 中 
但 没有 出 现在 中 的 自由 变量 的 值 。 不 过 ， 如 果 解 释 中 包含 进 没 有 用 到 的 额外 信息 ， 是 不 存在 任何 概念 困难 的 。 
@) 技术 上 讲 ， 即 使 对 EB 应 用 了 涉及 X 的 量词 ，EB1 还 是 可 能 不 含 任何 作为 自由 变量 的 X。 在 这 种 情况 下 ， 量 词 可 能 也 

不 存在 ， 但 我 们 没有 阻止 它 出 现 。 








+ 示例 14.12 

这 里 在 给 定 对 p 的 解释 了 ， 以 及 对 应 自由 变量 X 和 7 的 值 分 别 是 3 和 7 的 情况 下 ， 要 为 表达 式 
(14.5) 求 值 。 对 应 (14.5) 的 表达 式 树 如 图 14-8 所 示 。 我 们 看 到 ， 根 节点 处 的 运算 符 是 一 。 之 前 并 
未 明确 介绍 过 这 种 情况 ， 不 过 原则 应 该 是 很 清楚 的 。 整 个 表达 式 可 以 写成 已 一 已 ， 其 中 已 是 
p(X,Y) ， 而 是 (32)(p(X,Z)ANDp (Z,7)) 。 因 为 一 的 含义 ， 所 以 除了 互 为 真 而 且 已 为 假 的 
情况 ， 整 个 表达 式 (14.5) 都 为 真 。 





p(X,Y) (32) 


p(X,Z) p(Z,Y) 
图 14-8 ”对 应 (14.5) 的 表达 式 树 
,也 就 是 p(,7) ,是 很 容易 求 值 的 。 因为 =3 ,了 =7, 而 且 当 有 目 仅 当 X<Y 时 p(X,7) 
为 真 ， 所 以 可 以 得 出 五 为 真 。 为 为 求 值 则 更 为 困难 。 我 们 必须 为 Z 考 虑 所 有 可 能 的 值 v"， 以 了 解 
是 否 至 少 存在 一 个 值 使 p(X,Z) AND p(Z,7) 为 真 。 例 如 ， 如 果 尝 试 Z =0 ， 那么 p(Z,7) 为 真 ， 
但 p(X,2) 为 假 ， 因 为 X=3 是 不 小 于 2Z 的 。 








能 否 计算 表达 式 的 值 ? 
大 家 可 能 会 怀疑 在 EP 是 (3X)E 或 (VX)E 的 情况 下 ,我 们 对 表达 式 E 值 为 1 的 定义 。 如 果 定 
义 域 D 是 无 限 的 ,那么 我 们 已 经 提出 的 在 各 解释 J 之 下 为 巨 求 值 的 测试 就 不 需要 对 应 其 执行 的 
算法 。 从 本 质 上 讲 ， 要 求 我 们 为 存在 量词 执行 以 下 函数 
for (each v in DD) 
if (有 1 is true under interpretation .,) 


return TRUE ; 
return FALSE ; 


并 为 全 称 量 词 执行 如 下 函数 
for (each v in D) 
if (BE1 is false under interpretation .,) 


return FALSE; 
return TRUE; 


尽管 这 些 程 序 的 目的 很 明确 ， 但 它们 都 不 是 算法 ， 因 为 若 定 义 域 D 是 无 限 的 ， 则 要 进行 无 
数 次 循环 。 不过， 虽然 可 能 没 法 分 辨 E 是 真 还 是 假 ， 但 我 们 还 是 给 出 了 E 何 时 为 真 的 正确 定义 ， 
也 就 是 说 , 我 们 为 量词 vV 和 赋予 了 预期 的 含义 。 在 很 多 实际 且 实 用 的 情形 中 ，, 我们 将 能 够 分 
清 E 是 真 还 是 假 。 在 另 一 些 情 况 中 ,我 们 会 看 到 是 真 还 是 假 都 是 没关系 的 ， 例 如 涉及 将 表达 
式 变 形 为 等 价 形式 的 情况 。 可 以 在 不 知道 是 否 存 在 令 轧 这 样 的 子 表达 式 为 真 的 值 y 的 情况 下 ， 
根据 两 个 表达 式 的 值 的 定义 来 推理 它们 是 等 价 的 。 
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如 果 考 虑 这 种 情况 ， 就 会 看 到 ， 要 使 p(X,Z)AND p(Z,7) 为 真 ， 就 需要 v 的 值 满足 3<v (从 
而 让 P(X,Z) 为 真 ), 并 满足 v<7( 从 而 使 p(Z,7) 为 真 ), 例如 , v=4 就 能 使 p(X,Z)ANDp(Z,7) 
为 真 ， 并 因此 证 明了 E,， 或 者 说 证 明了 (32)(p(X,Z)AND p(2Z,7)) 对 给 定 的 解释 而 言 为 真 。 

现在 可 知 互 和 万, 都 为 真 。 因 为 当 EE 和, 痢 为 真 时 一 妃 为 真 ， 所 以 可 以 得 出 结论 ,在 
谓词 pz 具有 解释 1,， 而 且 XY=3 ，Y=3 的 情况 下 ， 表 达 式 (14.5) 的 值 是 1。 











14.5.2 ”习题 


(1) 分别 为 以 下 各 表达 式 给 出 一 种 使 其 为 真 的 解释 以 及 一 种 使 其 为 假 的 解释 。 
(a) (YX)3Y) (loves(X,7)) 
(b) p(X)— NOT p(X) 
(c) (3X)p(X) > (VX)p(X) 
(d) (p(X,Y)AND p(Y,Z))— p(X,2) 
(2) 解释 一 下 ， 为 什么 每 种 解释 都 能 使 表达 式 p(X) 一 p(X) 为 真 。 


14.6 ” 重 言 式 


回想 一 下 ,在 命题 逻辑 中 ,如 果 对 每 种 真 值 赋值 而 言 ， 表 达 式 的 值 都 是 1， 就 说 该 表达 式 是 
重 言 式 。 同 样 的 概念 在 谓词 逻辑 中 也 是 成 立 的 。 如 果 对 E 的 每 种 解释 ，E 的 值 都 是 1， 则 说 表达 
式 E 是 重 言 式 。 


+ 示例 14.13 
就 像 在 命题 逻辑 中 那样 ,“ 随 机 的 ”谓词 逻辑 表达 式 很 少 是 重 言 式 。 例 如 , 我 们 在 示例 14.10 
中 研究 过 的 表达 式 (14.3)， 或 者 说 
p(X,Y) > (32)(p(X,Z)AND p(2Z,7)) 
在 某 些 针对 谓词 p 的 解释 之 下 总 为 真 , 但 是 存在 像 示 例 14.10 中 的 五 这 样 的 解释 : p 是 针对 整数 的 
<， 让 该 表达 式 不 总 是 为 真 ， 比 如 ， 对 和 =1 和 了 = 2 ， 该 表达 式 为 假 。 因 此 ， 该 表达 式 不 是 重 
育 趟 。 


表达 式 

















q(X) OR NOT gq(X) 
就 是 个 重 言 式 。 这 里 , 不 管 为 谓词 gq 使 用 什么 解释 , 或 者 为 自由 变量 X 姑 什 么 值 , 都 是 没关系 的 。 
如 采 所 选择 的 解释 使 得 9C9O 为 真 ， 那 么 该 表达 式 为 真 。 


14.6.1 蔡 换 原则 


命题 逻辑 重 言 式 是 谓词 逻辑 重 言 式 的 丰富 来 源 。 我 们 在 12.7 节 中 介绍 过 的 蔡 换 原则 表明 ， 
可 以 取 任 意 命 题 逻 辑 重 言 式 ， 对 其 中 的 命题 变量 进行 任何 替换 ， 得 到 的 结果 仍然 是 重 言 式 。 如 
果 人 允许 用 谓词 逻辑 表达 式 蔡 换 命题 变量 ， 那 么 该 原则 仍然 成 立 。 例 如 ,示例 14.13 中 提 到 过 的 重 
言 式 gCOOR NOT q(X)， 束 是 用 表达 式 q(X) 葵 换 了 重 言 式 p OR NOT p 中 的 命题 变量 p。 

用 谓词 逻辑 表达 式 蔡 换 命题 变量 时 替换 原则 成 立 的 原因 ， 与 用 命题 表达 式 蔡 换 命题 变量 时 
该 原则 成 立 的 原因 基本 相同 。 在 用 dgC9O 这 样 的 表达 式 蔡 代 表达 式 中 出 现 的 某 一 命题 变量 p 时 , 我 
们 知道 ， 对 任何 解释 来 说 ， 所 蔡 换 的 表达 式 不 管 出 现在 何 处 都 有 者 相同 的 值 。 因 为 原 有 的 《我 
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们 要 对 其 进行 替换 的 ) 命题 逻辑 表达 式 是 重 言 式 ,所 以 在 将 其 中 其 个 命题 变量 全 部 替换 为 0, 或 
者 全 部 替换 为 1 时 ， 该 表达 式 总 是 为 真 。 

例如 ， 在 表达 式 q(X) oR NOT g(C 纹 中 ， 不 管 g 的 解释 是 什么 或 2 的 值 是 什么 ，gCO 要 么 为 真 ， 要 
么 为 假 。 因 此 ， 这 个 表达 式 要 么 变 成 1 oR NoT 1， 要 么 变 成 0 oR NOT 0， 而 这 两 个 式 子 的 值 都 是 1。 


14.6.2 ”表达 式 的 等 价 

和 命题 钦 辑 中 一 样 ， 如 果 两 个 谓词 软 辑 表达 式 B 和 下 满足 = 厂 是 重 言 式 ， 就 可 以 定义 它们 
是 等 价 的 。 在 讲 到 谓词 逻辑 表达 式 等 价 时 ，12.7 节 中 介绍 过 的 “以 相等 换 相等 原则 ”继续 成 立 。 
也 就 是 说 ,如果 等 价 于 5,， 那 么 可 以 用 , 代 蔡 任 一 表达 式 下 中 的 ,得 到 的 表达 式 厂 将 是 
等 价 的 ， 也 就 是 说 已 = 瓦 。 


+ 示例 14.14 
AND 运 算 的 交换 律 是 (p AND 9)=(g ANDp)。 现 在 ， 如果 有 (p(X)AND q(Y,2Z))OR gq(X,7) 这样 
的 表达 式 ， 那 么 可 以 用 9(7,Z) AND p(X) 替换 p(X) ANDgq(Y,Z) ， 产 生男 一 个 表达 式 
(q(7,2) AND p(X)) OR gq(Y,Z) 


























并 知道 
((p(X)AND 4(7,Z))OR gq(X,7))=((q(Y,2)AND p(X))oR gq(X,7)) 

还 有 一 些 更 微妙 的 等 价 谓词 逻辑 表达 式 。 通 常 ， 我 们 会 认为 等 价 表 达 式 有 着 相同 的 自由 变 

量 和 谓词 ， 不 过 有 些 情 况 下 自由 变量 和 (或 ) 谓词 可 以 是 不 同 的 。 例 如 ， 表 达 式 
(p(X)OR NOT p(X))=(g(Y)OR NOT 9(7)) 
就 是 重 言 式 ， 因 为 = 两 边 的 表达 式 如 我 们 在 示例 14.13 中 论证 过 的 都 是 重 言 式 。 因 此 ， 在 表达 式 
p(X)OR NOT p(X)OR g(X) 中 可 以 用 g(7Y)oR NoT g(7) 符 换 p(X)OR NOT p(X) ， 从 而 得 到 
(p(X)OR NOT p(X)OR gq(X))=(g(Y)OR NOT gq(Y)OR gq(X)) 
因为 = 的 左边 是 重 言 式 ， 所 以 还 可 以 得 出 
q(Y)OR NOT 9( 了 )OR g(X) 











是 重 言 式 的 结论 。 
14.6.3 ”习题 
解释 以 下 各 表达 式 为 何 是 重 言 式 。 也 就 是 说 ， 我 们 为 命题 逻辑 重 言 式 替换 了 什么 样 的 谓词 逻辑 表 
达 式 ? 
(a) (p(X)OR gq(7))=(g(Y)OR p(X)) 
(b) (p(X,Y)AND p(X,7))= p(X,Y) 
(c) (p(X)— FALSE)=NOT p(X) 


14.7 涉及 量词 的 重 言 式 


涉及 量词 的 谓词 逻辑 重 言 式 在 命题 逻辑 中 没有 直接 的 参照 物 。 本 节 要 探究 这 些 重 言 式 ， 并 
展示 如 何 利 用 它们 处 理 表达 式 。 而 主要 成 果 就 是 可 以 将 任何 表达 式 转换 成 量词 全 在 开头 位 置 的 
等 价 表达 式 。 
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14.7.1 变量 的 重 命名 


在 C 语 言 中 ， 可 以 改变 局 部 变量 的 名 称 ， 只 要 对 所 有 用 到 该 局 部 变量 的 地 方 进行 统一 修改 
即 可 。 类 似 地 ， 也 可 以 改变 量词 中 用 到 的 变量 ， 只 要 对 所 有 出 现 受到 该 量词 约束 的 这 一 变量 的 
地 方 进 行 修改 。 还 有 ， 就 像 在 C 语 言 中 那样 ， 一 定 要 谨慎 选择 新 的 变量 名 ， 因 为 如 果 选 择 的 名 
称 已 经 在 所 考虑 孔 数 之 外 定义 ， 那 么 就 可 能 改变 程序 的 含义 ， 就 会 造成 严重 的 错误 。 

记 住 这 种 重 命名 ， 我 们 可 以 考虑 以 下 类 型 的 等 价 ， 以 及 在 何 条 件 下 它 是 重 言 式 。 

(OXF)E =(ODE' (14.6) 

其 中 E' 是 把 E 中 所 有 受到 这 里 明确 给 出 的 量词 (OX) 约束 的 X 蔡 换 为 7 后 得 到 的 。 我 们 说 
(14.6) 是 重 言 式 , 只 要 E 中 没有 出 现 自 由 变量 7 要 知道 原因 , 可 以 考虑 任 一 对 应 (OX)E 的 解释 J。 
或 者 等 价 地 ， 对 应 (0O7Y)E" ， 因 为 两 个 量词 化 表达 式 的 自由 变量 和 谓词 是 相同 的 。 如 果 通 过 为 X 
给 定 值 y 扩 展 过 的 厂 得 E 为 真 ， 那么 IT 和 对 应 7 的 值 vy 也 能 让 E' 为 真 。 相 反 ， 如 果 通 过 为 X 给 定 值 v 
扩展 的 一 2 为 假 ， 那 么 扩展 的 I 和 对 应 7 的 v 也 使 2' 为 假 。 

如 果 量 词 O 是 3 , 那么 假设 存在 对 应 X 的 值 使 得 £ 为 真 , 就 存在 某 个 对 应 7 的 值 v, 使 得 E' 为 
真 ， 相 反 ， 假设 存在 X 的 值 y 使 得 E 为 假 ， 就 存在 对 应 7 的 值 使 得 E' 为 假 。 如 果 O 是 v ， 那 么 当 
且 仅 当 所 有 的 7Z 值 使 已 为 真 时 ， 所 有 的 XY 值 使 有 为 假 。 因 此 ， 对 任 一 量词 而 言 ， 在 给 定 的 任 一 解 
释 ] 之 下 ， 当 日 仅 当 (07)E' 在 相同 解释 下 为 真 时 ，(QX)E 才 为 真 ， 这 就 证 明了 如 下 表达 式 是 重 


言 式 。 
































(OX)E=(O7)E 


+ 示例 14.15 

考虑 刚好 是 重 言 式 的 表达 式 

(3X)p(X,Y))OR NOT((3X)p(X,7)) (14.7) 

我 们 要 展示 如 何 为 这 两 个 X 中 的 一 个 重 命名 ， 以 形成 两 个 量词 中 使 用 不 同 变量 的 男 一 个 重 言 式 。 

如 果 设 表达 式 (14.6) 中 的 BE 是 p(X,7) ， 并 且 选 择 变量 2Z 扮 演 (14.6) 中 7 的 角色 ， 就 有 重 言 式 
((3X)p(X, 了 站))=((32)p(2Z,7))。 也 就 是 说 ， 如 果 要 构造 表达 式 已 ， 就 要 用 2 替换 E= p(X,7) 中 
的 X， 从 而 得 到 p(Z,Y) 。 因 此 ,可 以 “以 相等 换 相 等 "， 把 (14.7) 中 的 第 一 个 GY)P(X,D) 替换 为 
(32Z)p(Z,Y) ， 以 得 出 表达 式 

















((32)p(2Z,Y))OR NOT((3X)p(X,7)) 
该 表达 式 等 价 于 (14.7)， 因 此 也 是 重 言 式 。 

请 注意 ， 也 可 以 用 Z 蔡 换 (14.7) 第 二 半 中 的 X， 是 否 这 样 做 都 是 无 关 紧 要 的 ， 因 为 这 两 个 量 
词 定义 了 没有 关系 的 不 同 变量 ， 只 不 过 在 (14.7) 中 它们 都 被 命名 为 x。 不过， 我 们 应 该 明白 , 任 
何 一 个 3X 都 不 能 用 37Y 替代 ， 因 为 在 出 现 的 两 个 子 表达 式 p(X,7) 中 都 是 自由 变量 。 

也 束 是 说 ，((3X)p(X, 了 站))=c 不 是 重 言 式 (14.6) 的 实例 ,因为 7 是 p(X,7) 中 的 自由 变量 。 要 
知道 这 为 什么 不 是 重 言 式 ， 可 以 设 把 p 解 释 为 针对 整数 的 <。 那 么 对 自由 变量 7 的 任何 值 ， 比 方 
说 了 =10 ， 表 达 式 (3X)p(X,7) 都 为 真 ， 因 为 我 们 可 以 设 人 =9 。 不 过 该 等 价 的 右边 一 一 
(3Y)p(X,Y) 为 假 ， 因 为 没有 哪个 整数 严格 小 于 自身 。 

同样 ， 也 不 能 用 (3 了 7)p(X,7) 蔡 换 (14.7) 中 (3X)p(X,7) 的 第 一 个 实例 。 因 为 得 到 的 表达 式 

(7)p(Y,7Y))oOR NOT((3X)p(X,7)) (14.8) 
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也 不 可 能 是 重 言 式 。 这 里 还 是 设 p 的 解释 为 针对 整数 的 <， 并 设 自由 变量 7 的 值 是 10。 请 注意 ， 
在 (14.8) 中 ,出 现在 p(X,7) 中 的 两 个 ?者 是 受到 量词 3 约束 的 , 只 有 出 现在 p(X,Y) 中 的 最 后 
一 个 7 是 自由 的 。 那么 (3 六)p(Y,7) 对 这 一 解释 而 言 为 假 , 因为 没有 7 的 值 比 它 自身 小 。 另 一 方面 ， 
当 了 =10 (或 其 他 任何 整数 ) 时 ，(3X)p(X,7) 为 真 ， 所 以 NOT(GX)p(X, 六 )) 为 假 。 这 样 一 来 ， 
表达 式 (14.8) 对 这 一 解释 而 言 为 假 。 











让 量词 化 的 变量 唯一 

(14.6) 式 有 个 有 意思 的 结果 ， 就 是 我 们 总 是 可 以 把 任何 谓词 逻辑 表达 式 E 转 换 成 等 价 表达 
式 ， 使 其 没有 两 个 量词 使 用 同一 变量 ,而 且 没 有 量词 使 用 在 中 也 作为 自由 变量 的 变量 。 这 样 
的 表达 式 称 为 修正 表达 式 (rectified expression )。 

在 证 明 过 程 中 , 我 们 可 能 从 重 言 式 已 = 已 开始 ,然后 利用 (14.6)， 以 匹 中 未 使 用 过 的 新 变量 ， 
依次 为 右边 的 EE 中 各 量词 化 的 交 量 重 命名 。 得 到 的 结果 是 表达 式 =E' ,其 中 Er' 中 所 有 的 量词 
(QOX) 都 涉及 不 同 的 ， 而 这 些 X 也 不 是 EB 或 E' 中 的 自由 变量 。 根 据 命 题 逻辑 中 等 价 的 传递 性 ， 
EE=E' 是 重 言 式 ， 也 就 是 说 BE 和 E' 是 等 价 的 表达 式 。 





14.7.2 ”自由 变量 的 全 称 量词 化 


只 有 在 其 目 由 变量 全 称 量词 化 的 相同 表达 式 为 重 言 式 时 ， 带 有 上 自由 变量 的 表达 式 才 可 能 是 
重 言 式 。 严 格 来 讲 ， 对 所 有 重 言 式 T7 和 变量 X 而 言 ，(VX)7 也 是 重 言 式 。 技 术 上 讲 ， 出 现在 7 中 
的 X 是 否 自由 都 是 没关系 的 。 

要 知道 (YX)7 为 什么 是 重 言 式 , 设 Y…、X 是 7 的 自由 变量 , X 可 能 是 其 中 一 员 , 也 可 能 不 
是 。 首先, 假设 X=7。 我 们 需要 证 明 ， 对 所 有 的 解释 J，(vYX)T 为 真 。 等 价 地 讲 ， 也 就 是 需要 
证 明 ， 对 7 的 定义 域 中 的 每 个 值 "， 通 过 为 X 给 定 值 y 而 由 世 成 的 解释 7 使 7 为 真 。 但 7 是 重 言 式 ， 
所 以 每 种 解释 都 会 使 其 为 真 。 

如 有 果 X 是 7 的 其 他 自由 变量 7 中 的 某 一 个 , 那么 论证 (VX)7 为 重 言 式 的 过 程 本 质 上 讲 是 相同 
的 。 如 果 X 不 是 忒 中 的 一 员 ， 那 么 它 的 值 不 会 对 7 的 真 假 产 生 影响 。 因 此 7 对 所 有 的 3 缉 为 真 ， 就 
因为 7 是 重 言 式 。 


14.7.3” 闭 表达 式 


一 个 有 意思 的 结果 是 ， 对 重 言 式 来 说 ， 可 以 假设 不 存在 目 由 变量 。 我 们 可 以 利用 之 前 的 变 
形 ， 一 次 全 称 量词 化 一 个 自由 变量 。 不 含 自 由 变量 的 表达 式 就 叫 作 闭 〈closed ) 表达 式 。 


+ 示例 14.16 
我 们 知道 p(X,Y 了 )oR NOTp (和 ,站 是 重 言 式 。 可 以 为 自由 变量 X 和 Y 加 上 全 称 量词 ， 得 到 重 


















































(VE)(VI)(p(X,Y)OR NOTp (X,Y)) 
14.7.4 ”把 量词 移 过 NOT 
存在 德 摩 根 律 的 无 限 版 本 ， 主 我 们 可 以 用 3 蔡 代 Y ， 反 之 亦 然 ， 就 像 “ 普 通 的 ” 德 摩根 律 
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允许 我 们 在 移 过 NOT 的 时 候 ， 在 AND 和 oR 之 间 切 换 一 样 。 假 设 有 像 
NOT((vVX)p(X)) 
这 样 的 表达 式 。 如 果 定 义 域 值 的 数量 是 有 限 的 ， 比 方 说 是 v 、…、v, ， 那 么 可 以 把 该 表达 式 看 
作 NOT( p(w)AND p(v,)AND…AND p(v,)) 。 然 后 ， 可 以 应 用 德 摩根 律 把 该 表达 式 重 新 写 为 
NOT p(v)OR NOT p(v,)OR…OR NOT p(v,)。 在 有 限定 义 域 的 假设 之 下 ， 这 一 表达 式 就 等 同 于 
GZ)(NOT p(X)) ， 也 就 是 说 ， 对 某 个 X 的 值 ，p(X) 为 假 。 
事实 上 ， 这 一 变形 并 不 取决 于 定义 域 的 有 限 性 ， 它 对 每 种 可 能 的 解释 来 说 都 是 成 立 的 。 也 
就 是 说 ,下面 的 等 价 对 任何 表达 式 E 来 说 都 是 重 言 式 。 
(NoT((vXI)E))=((3X)(NoT 万 )) (14.9) 
粗略 地 讲 ，(14.9) 表 示 ， 刚 好 在 存在 某 个 X 的 值 令 E 为 假 时 ，E 对 所 有 的 X 都 不 为 真 。 
还 有 一 个 类 似 的 重 言 式 让 我 们 可 以 把 NOT 压 和 人 存在 量词 。 
(NoT((3X)E))=((YX)NoT E)) (14.10) 
粗略 地 讲 就 是 ， 刚 好 当 E 对 所 有 XX 来 说 都 为 假 时 ， 不 存在 X 使 为 真 。 
+ 示例 14.17 
考虑 我 们 根据 命题 逻辑 重 言 式 p OR NOT p ， 利 用 替换 原则 得 到 的 重 言 式 
(VX)p(X)OR NOT((vX)p(X)) (14.11) 
可 以 令 (14.9) 中 的 B=p00, 用 (3X)(NoOT p(X)) 蔡 换 (14.1D) 中 的 NOT((YX)p(X)) , 得 到 重 言 式 
(VX)p(X)OR(IX)(NOT p(X)) 
也 就 是 说 ， 要 么 p(X) 对 所 有 的 X 者 为 真 ， 要 人 么 存在 某 个 X 令 p(X) 为 假 。 
14.7.5 把 量词 移 过 AND 和 OR 
在 从 左 向 右 应 用 法 则 (14.9) 和 (14.10) 时 , 可 以 把 量词 移 到 否定 之 外 ,并 在 这 样 做 的 过 程 中 “ 反 
转 ” 量 词 ， 也 就 是 用 v 代 蔡 习 ， 用 3 代 蔡 Vv。 同样 ， 可 以 把 量词 移 到 AND 或 OR 之 外 ， 不 过 一 定 
要 小 心 ， 不 能 改变 其 中 出 现 的 任何 变量 的 约束 情况 。 还 有 ， 我 们 在 移 过 AND 或 OR 时 不 会 反 转 量 
词 。 这 些 法 则 的 表达 式 为 



































(EAND(OX)F)= (OX)(E AND F) (14.12) 
(E OR(OX)F)=(QX)(E ORF) (14.13) 
其 中 E 和 是 任何 表达 式 ， 而 0O 是 任 一 量词 。 不 过 ， 我 们 要 求 X 在 E 中 不 是 自由 变量 。 
为 AND 和 OR 都 是 满足 交换 律 的 ， 所 以 还 可 以 使 用 (14.12) 和 (14.13) 移 动 附加 到 AND 或 OR 左 
操作 数 上 的 量词 。 例 如 ， 由 (14.12) 以 及 AND 的 交换 律 可 得 出 如 下 表达 式 
((QX)E AND F )=(QX)(E AND 7) 
这 里 ， 我 们 要 求 X 在 F 中 不 是 作为 自由 变量 出 现 的 。 
+ 示例 14.18 
我 们 来 为 示例 14.17 中 得 出 的 重 言 式 ， 也 就 是 
(YY)P(X)ORGX)(NOT p(X)) 
变形 ， 使 得 量词 都 在 表达 式 之 外 。 首 先 ， 需 要 为 两 个 量词 之 一 所 使 用 的 变量 重 命 名 。 根 据 法 则 
(14.6)， 可 以 用 (37)NOT p(7) 替代 (3X)NOT p(X) ， 得 出 重 言 式 
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(VX)p(X)OR(IY) (NOT p(7)) (14.14) 
现在 可 以 利用 (14.13) 的 变形 ， 也 就 是 利用 量词 移 到 OR 运算 左 操 作 数 上 的 那个 重 言 式 , 将 Vv 移 到 
OR 之 外 ， 得 到 的 表达 式 就 是 
(VX) (p(X)OR(3Y) (NOT p(7))) (14.15) 
表达 式 (14.15) 与 (14.14) 只 是 形式 不 同 ,含义 却 没 什么 不 同 。(14.15) 表 述 的 是 ， 对 所 有 的 X 的 值 ， 
(1) p(X) 为 真 ; 
(2) 存在 某 个 值 7?， 使 p(7) 为 假 。 
要 知道 (14.15) 为 何 是 重 言 式 ， 可 以 考虑 对 应 X 的 某 个 值 v。 如 果 所 考虑 的 解释 使 p(v) 为 真 ， 那 么 
有 p(X)OR(37)(NOT p(X)) 为 真 。 如 果 p(v) 为 假 ， 那 么 在 这 一 解释 中 ，(2) 肯 定 成 立 。 特 别 要 说 
的 是 ， 当 了 =v 时 ，NOT p(X) 为 真 ， 因此 (37)(NOT p(7)) 为 真 。 
最 后 ， 可 以 应 用 (14.13), 将 3Y 移 到 oR 运算 之 外 ， 得 到 的 表达 式 就 是 
(YX)(3Y)(p(X)OR NOT p(7)) 
该 表达 式 也 一 定 是 重 言 式 。 粗 略 地 讲 ， 它 所 表述 的 是 ， 对 每 个 X 的 值 ， 存 在 某 个 7 的 值 ， 使 得 
p(X)OR NOT p(7) 为 真 ,要 知道 原因 , 设 v 是 X 可 能 的 取 值 之 一 ,如果 p(v) 在 给 定 解释 /之 下 为 真 ， 
那么 显然 有 如 下 表达 式 为 真 ， 不 管 7 是 什么 。 
p(X)OR NOT P(7) 
如 果 p(v) 在 解释 站 为 假 ， 就 可 以 为 ?选择 v， 这 样 六 (P(Z)OR NoT p(7)) 就 为 真 。 


14.7.6 ”前 束 式 


法 则 (14.9)、(14.10)、(14.12) 和 (14.13) 带 来 的 结果 是 ,给 定 任 一 涉及 量词 与 逻辑 运算 符 AND、 
OR 和 NOT 的 表达 式 ， 可 以 为 其 找到 量词 全 部 在 外 部 〈 在 表达 式 树 的 顶部 ) 的 等 价 表达 式 。 也 就 
是 说 ， 可 以 找到 形 如 

















(QAXIN(OX,) (OXOE (14.16) 

的 等 价 表 达 式 , 其 中 2 、…、0O, 各 自 代表 量词 v 或 3 中 的 某 一 个 , 而 且 子 表达 式 B 是 无 量词 的 。 
如 此 则 称 表 达 式 (14.16) 是 前 束 式 (prenex form ) 的 。 

通过 以 下 两 步 ， 就 可 以 把 表达 式 变 形 为 前 束 式 表 达 式 。 

(1) 修正 表达 式 。 也 就 是 说 ， 利 用 法 则 (14.6)， 使 各 个 量词 引用 不 同 的 变量 ， 出 现在 一 个 量 
词 中 的 变量 既 不 会 出 现在 另 一 个 量词 中 ， 也 不 会 作为 表达 式 的 自由 变量 出 现 。 

(2) 然后 ， 根 据 法 则 (14.9) 和 (14.10) 把 各 量词 移 过 NoT ， 根 据 法 则 (14.12) 移 过 AND， 并 根据 
(14.13) 移 过 OR。 




















前 束 式 程序 
原则 上 讲 ， 只 要 重 命名 所 有 局 部 变量 ,使 它们 全 都 具有 不 同 的 变量 名 ， 然 后 将 它们 的 声明 
移 到 主 程序 中 ， 我 们 也 可 以 把 C 语 言 程序 表示 为 前 束 式 程序 。 不 过 一 般 不 会 这 么 做 ， 而 是 会 选 
择 在 局 部 声明 变量 ， 比 方 说 ， 这 样 一 来 就 不 必 担 心 为 在 10 个 不 同 函数 中 用 作 循 环 指标 的 变量 1 
使 用 各 种 不 同 的 变量 名 了 。 对 逻辑 表达 式 来 说 ， 通 常 都 有 理由 将 表达 式 表示 为 前 束 式 表达 式 ， 
虽然 这 一 问题 超出 了 本 书 的 范围 。 
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+ 示例 14.19 

示例 14.17 和 示例 14.18 都 是 这 一 过 程 的 例子 。 从 给 出 表达 式 (YXY)P(X)OR NOT((YXY) p(X)) 
的 示例 14.17 开 始 ， 通 过 把 第 二 个 V 移 过 NOT， 就 得 到 示例 14.18 中 一 开始 的 表达 式 

(VX)p(X)OR(3X) (NOT p(X)) 

然后 我 们 为 用 到 的 第 二 个 X 重 命名 ， 这 是 一 开始 就 可 以 完成 而 且 应 该 完成 的 。 通 过 把 两 个 
量词 移 过 OR 运算 符 ， 就 得 到 前 束 式 表 达 式 (VX)(37)(p(X)OR NOT p(7Y))。 

请 注意 ， 涉 及 AND、OR 和 NOT 之 外 的 逻辑 运算 符 的 表达 式 也 可 以 变形 为 前 束 式 表达 式 。 正 
如 我 们 在 第 12 章 中 了 解 到 的 , 每 种 逻辑 运算 符 都 可 以 用 AND 、OR 和 NOT 表 示 出 来 。 例 如 , EE 一 下 
就 可 以 替换 为 NoT 5 OR F 。 如 果 把 各 逻辑 运算 符 都 用 AND、oOR 和 NOT 表 示 出 来 ， 就 能 够 应 用 刚 
刚 概述 过 的 变形 方式 找到 等 价 的 前 束 式 表 达 式 。 


14.7.7 量词 的 重新 排列 


最 后 要 介绍 的 重 言 式 指出 了 ， 将 全 称 量 词 应 用 于 两 个 变量 ， 排 列 这 两 个 量词 的 次 序 是 没 
关系 的 。 同 样 ， 也 可 以 用 任 一 次 序 排列 两 个 存在 量词 。 严 格 地 讲 就 是 ， 以 下 两 个 表达 式 是 重 


言 式 。 
































(VOI(YDE=(VDYVI)E (14.17) 

(3X)IDE= (DDE (14.18) 
请 注意 ,根据 (14.17), 我 们 能 够 把 任 一 v 串 (YX )(vVX,)…)(vX,) 排列 成 选 定 的 任意 次 序 。 事 实 
上 ，(14.17) 就 是 Y 的 交换 律 。 同 样 的 结论 对 法 则 (14.18)( 即 3 的 交换 律 ) 也 是 成 立 的 。 


14.7.8 习题 


(1) 将 以 下 表达 式 变 形 为 修正 表达 式 ， 也 就 是 说 ， 任 两 个 量词 不 会 共用 同一 变量 的 表达 式 。 
(a) (3X)((NOT p(X))AND((37)( p(Y))ORGAX) (gq(X,2)))) 
(b) (3X)((3X)p(X)OR(AX)g(X)OR r(X)) 

(2) 通过 把 各 自由 变量 全 称 量词 化 ， 将 以 下 表达 式 转换 为 团 表 达 式 。 如 果 需 要 的 话 ， 可 以 为 变量 重合 
名 ， 使 两 个 量词 不 会 使 用 相同 变量 。 
(a) P(X ID)AND(37D)4(07) 
(b) (VX)( p(X,Y)OR(A3X)p(Y, X)) 

(3)* 法 则 (14.12) 是 否 暗 指 p(X,7)NOT(YX)q(X) 与 (VX)(p(X,Y)ANDq(X)) 是 等 价 的 ? 对 自己 的 回答 
作出 解释 。 

(4) 把 习题 (1) 中 的 表达 式 变形 为 前 束 式 表 达 式 。 

(5)* 说明 如 何 把 量词 移 过 一 运算 符 。 也 就 是 说 ， 如 何 把 表达 式 ((OX)E) 局 ((Q,7)) 变形 为 前 束 式 表 
达 式 。 大 家 需要 对 E 和 Ff 中 的 自由 变量 进行 什么 约束 ? 

(6) 我 们 可 以 利用 重 言 式 (14.9) 和 (14.10) 把 NOT 移 进 量词 和 移出 量词 。 利 用 这 些 法 则 以 及 德 摩根 律 ， 可 
以 移动 所 有 的 NOT， 使 它们 直接 应 用 到 原子 公式 上 。 为 下 列表 达 式 应 用 这 种 变形 
(a) NOT((vX)(37)p(X,7)) 
(b) NOT((vX)(p(X)OR(3Y)g(X,7))) 

(7)* 只 要 (3X)E 是 重 言 式 ，E 就 是 重 言 式 ， 这 样 的 说 法 是 否 正 确 ? 
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14.8 谓词 逻辑 中 的 证 明 


在 14.8 和 14.9 这 两 节 中 将 讨论 谓词 逻辑 中 的 证 明 。 不 过 ， 我 们 不 会 把 12.11 节 中 的 分 解法 扩 
展 到 谓词 逻辑 中 ， 虽 然 这 样 也 是 可 行 的 。 事 实 上 ， 分 解 对 很 多 使 用 谓词 逻辑 的 系统 来 说 也 是 极 
为 重要 的 。 这 种 证 明 机 制 将 在 12.10 节 中 介绍 。 回 顾 一 下 ， 在 命题 逻辑 的 证 明 中 ， 给 定 某 些 表 达 
式 E  、E,、…、E, 作为 前 提 或 者 说 “公理 ”， 并 构造 一 系列 表达 式 ( 行 )， 使 各 表达 式 符 合 下 
列 条 件 之 一 。 

ee 

(2) 根据 推理 规则 ， 是 用 之 前 的 0 个 或 更 多 表达 式 得 到 的 。 
推理 规则 必须 具有 以 下 属性 ， 只 要 我 们 因为 已 、 玉 、…、 环 出 现在 表达 式 列 中 ， 而 可 以 向 表 
达 式 列 中 添加 Fr， 就 有 





(FAND HAND:…ANDF ) OF 

是 重 言 式 。 

谓词 逻辑 中 的 证 明基 本 是 相同 的 。 当 然 ， 作 为 前 提 和 证 明 中 各 行 的 表达 式 都 是 谓词 逻辑 表 
达 式 ， 而 非 命题 逻辑 表达 式 。 此 外 ， 一 个 表达 式 的 自由 变量 与 另 一 个 表达 式 中 同名 的 自由 变量 
是 不 能 存在 关系 的 ， 所 以 会 要 求 前 提 和 证 明 中 各 行 都 是 闭 公 式 。 
14.8.1 隐 式 全 称 量词 

然而 ， 一 般 约 定 在 书写 证 明 中 的 表达 式 时 ， 不 会 显 式 给 出 最 外 层 的 全 称 量词 。 例 如 ， 考 虑 
示例 14.3 中 的 表达 式 

(csg(“CS101",S,G)AND snap(S,"C.Brown”, A,P)) 一 answer(G) (14.19) 

表达 式 (14.19) 可 能 是 证 明 的 某 一 前 提 。 在 示例 14.3 中 ， 我 们 赁 直觉 将 其 看 作 谓词 waswer 的 定义 。 
比方 说 ， 我 们 在 answer ("A")， 也 就 是 C.Brown 的 CS101 课 程 得 了 A 的 证 明 中 可 能 用 到 (14.19)。 

在 示例 14.3 中 ， 对 (14.19) 含 义 的 解释 是 ， 对 所 有 的 S、G、4 和 P 的 值 ， 如 果 说 学 号 为 $ 的 学 
生 CS101 课 程 得 到 了 成 绩 G， 也 就 是 说 ， 如 果 csg("CS101",S,G) 为 真 ， 而 且 学 号 为 $ 的 学 生 名 叫 
C.Brown， 地 址 为 4， 电 话 号 码 为 P， 也 就 是 说 ， 如 果 snap(5,"C.Brown",A,P) 为 真 ， 那 么 G 就 是 
一 种 答案 ， 即 answer (G) 为 真 。 在 示例 14.3 的 那个 例子 中 ， 我 们 还 没有 正式 的 量词 概念 。 不 过 ， 
现在 看 到 ， 真 正 想 要 断言 的 是 

(VS)(CVG)(Y4)(YP)(((csgCCS10T， S,G)AND snap(S,“C.Brown’”, 4,p)) — answer(G)) 
因为 经 党 需要 在 表达 式 前 引入 一 串 全 称 量词 ， 所 以 我 们 会 用 简化 符号 (v*)E 表示 一 串 全 称 量词 
(YX)(VX,)…(VYX,)E ， 其 中 对 、X,，、…、 了 ,是 表达 式 E 的 自由 变量 。 例 如 ，(14.19) 就 可 以 写成 
(v*)((csg("CS101", S,G)AND snap(S,"C.Brown", A,P)) 一 answer(G)) 

不 过 ,我们 将 继续 把 E 中 的 自由 变量 称 为 (v*)E 中 的 “自由 变量 *。 这 样 使 用 术语 “自由 ”严格 
来 讲 是 不 正确 的 ， 但 是 非常 实用 。 


14.8.2 ”作为 推理 规则 的 变量 蔡 换 


除了 第 12 章 中 讨论 过 的 对 应 命题 逻辑 的 推理 规则 外 ， 比 如 肯定 前 件 式 假 言 推理 ， 以 及 在 证 
明 的 前 一 行 中 进行 以 相等 换 相 等 的 蔡 换 ， 对 谓词 逻辑 中 的 证 明 来 说 还 有 一 种 特别 实用 的 涉及 变 
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量 闪 换 的 推理 规则 。 如 果 已 经 断言 作为 前 提 或 证 明 中 某 一 行 的 表达 式 E， 而 且 E' 是 通过 用 变量 
或 常量 替换 中 某 个 自由 变量 形成 的 表达 式 ， 那 么 -> E' 是 重 言 式 ， 而 且 我 们 可 以 向 证 明 中 添 
加 E' 这 样 一 行 。 务 必 记 住 ， 我 们 不 能 替换 E 的 约束 变量 ， 只 能 替换 E 的 自由 变量 。 

严格 地 讲 ， 可 以 用 函数 sub 作 为 表达 式 变量 的 于 换 。 对 E 中 各 自由 变量 X 而 言 ， 可 以 定义 
sub(X) 为 某 个 变量 或 某 个 常量 。 如 果 没 有 为 sub(X) 指定 值 ， 就 要 假设 想 要 的 是 sub(X)=X。 
如 果 E 是 任 一 谓词 逻辑 表达 式 , 表达 式 swb(E) 就 是 将 E 中 所 有 作为 自由 变量 出 现 的 X 用 sub(X) 过 
代 后 得 到 的 。 




















证 明 中 出 现 的 表达 式 
请 记 住 ， 如果 在 证 明 中 看 到 表达 式 E， 它 其 实 是 (Vv*)E 的 简略 形式 。 要 注意 到 =(V*)E 一 
般 不 是 重 言 式 ， 因 此 我 们 显然 是 在 用 一 个 表达 式 代表 一 个 与 之 不 同 的 表达 式 。 
还 要 记 住 ， 当 证 明 中 出 现 E 时 ， 并 不 是 在 断言 (V*) 巨 是 重 言 式 ,而 是 在 断言 (V*)E 是 根据 前 
提 得 出 的 。 也 就 是 说 ， 如 果 巨 、E,、…、 思 ,是 前 提 ， 而 且 正 确 书写 了 证 明 中 的 行 ， 则 可 知 
((V*)EAND(V*)E,AND.….AND(V*)E, ) > (VI)E 
是 重 言 式 。 





变量 替换 法 则 说 明 瓦 一 supb(ZE) 是 重 言 式 。 因 此 ， 如 果 丈 是 证 明 中 的 行 ， 就 可 以 在 同一 证 明 
中 加 入 sub(E) 这 一 行 。 


+ 示例 14.20 
考虑 以 表达 式 (14.19) 
(csg( CS10T ， S,G)AND snap(S,"C.Brown”, 4A,P)) 一 answer(G) 
作为 E。 可 以 将 一 种 可 能 的 蔡 换 sub 定 义 为 
sub(G)="B" 
sub(P)=S 
也 就 是 说 ， 这 里 要 用 常量 B 替 换 变 量 G， 并 用 变量 Ss 替换 变量 P。 而 变量 S 和 4 保持 不 变 。 表 达 式 
sub() 就 是 
(csg( CSI0T ， S“B”)AND snap(S,"C.Brown”, A,S)) 一 answer("B”) (14.20) 
通俗 地 说 ， 表达 式 (14.20) 的 意思 是 ， 如 果 学 生 S5 的 CS101 课 程 得 了 B, 该 学 生 的 姓名 是 C. Brown， 
而 且 该 学 生 的 电话 号 码 和 学 号 是 唯一 的 ， 那么 “B” 就 是 答案 。 
请 注意 ，(14.19) 表 达 了 更 具 一 般 性 的 规则 ， 而 (14.20) 只 是 它 的 一 个 特例 。 也 就 是 说 ， 只 
在 成 绩 为 B， 而 且 C. Brown 的 学 号 巧合 到 与 他 的 电话 号 码 相同 时 ，(14.20) 才 能 推理 出 正确 答案 ， 
否则 (14.20) 不 说 明 任 何 问 题 。 


+ 示例 14.21 
表达 式 

















p(X,Y)OR(3Y)g(X,2) (14.21) 
中 含有 自由 变量 X 和 了 Y， 以 及 约束 变量 Z。 回 想 一 下 ， 从 技术 上 讲 ，(14.21) 其 实 代表 闭 表 达 式 
(Vv)(p(X,7 了 ))OR(32Z)q(X,Z) ， 而 这 里 的 (Y9 代表 对 自由 变量 X 和 7 的 量化 ， 也 就 是 有 
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(VX)(VY) (p(X,7))OR(32)g(X,2) 

在 (14.21) 中 ， 可 以 替换 sup() 二 a 和 sub(7) 二 b， 得 到 表达 式 p(a,5)OR(3Z)q(a, Z) 。 不 难 
看 出 ， 这 一 不 含 自 由 变量 ( 因为 我 们 用 常量 蔡 换 了 其 中 各 自由 变量 ) 的 表达 式 是 (14.21) 的 一 个 
特例 ， 它 陈述 了 要 人 么 p(a,b) 为 真 ， 要 人 么 存在 某 个 Z 的 值 ， 使 得 p(a, Z) 为 真 。 正 式 地 讲 ， 

((VI)VH) (p(X, YORG2)g(X, 2))) > (p(a, b)OR(IZ)g(a, 2)) 








是 宣 守 3s 

有 人 可 能 想 知 道 在 用 a 和 4b 蔡 换 X 和 7Y 时 (14.21) 中 隐 含 的 量词 会 发 生 什 么 。 答 案 是 ， 得 到 的 表 
达 式 p(a, 5)OR(3Z)gq(a, z) 中 不 存在 自由 变量 ， 隐 含 的 表达 式 (Vv*)(p(a,5)OR(3Z)g(a,z)) 没 有 全 
称 量词 前 级 ， 也 就 是 说 








p(a, bP)OR(3Z )g(a, Z) 
在 这 种 情况 中 只 代表 自身 。 我 们 不 会 把 (v*) 替换 为 (Ya)(vb) ， 因 为 常量 不 可 能 被 量词 化 , 这样 
做 是 行 不 通 的 。 











蔡 换 的 特例 


示例 14.20 是 一 般 情况 ,其 中 只 要 我 们 对 表达 式 E 应 用 替换 sup， 得 到 的 就 是 的 特例 。 如 果 
SUD 用 常量 c 替 换 变 量 X， 那 么 表达 式 sup(E) 就 只 适用 于 和 =c 的 情况 ， 而 不 适用 于 其 他 情况 。 
如 果 supD 让 两 个 变量 变 得 相同 ， 那 么 suUpD(E) 就 只 适用 于 两 个 变量 具有 相同 值 的 特例 。 然 而 ， 变 
量 的 替换 往往 正 是 我 们 进行 证 明 时 所 需 的 ， 因 为 它们 让 我 们 可 以 在 特例 中 应 用 一 般 规则 ， 而 且 
让 我 们 可 以 将 规则 组 合 起 来 构成 其 他 规则 。 我 们 将 在 14.9 节 中 研究 这 种 形式 的 证 明 。 





14.8.3 ”习题 
根据 前 提 ， 利 用 12.10 节 中 讨论 过 的 推理 规则 以 及 刚刚 讨论 过 的 变量 替换 规则 , 证 明 以 下 结论 。 请 
注意 ,大 家 可 以 把 任何 命题 或 谓词 演算 的 重 言 式 用 作证 明 的 某 一 行 。 不 过 ,请 尽量 只 使 用 12.8 节 、 
12.9 方 和 14.7 节 中 介绍 的 重 言 式 。 
(a) 根据 前 提 (YX)p(X)， 证明 结论 (YXY)P(X)OR gq(Y) 。 
(b) 根据 前 提 (3X)p(X,7) ， 证 明 结论 NOT((VX)(NOT p(X,a)))。 
(c) 根据 前 提 PC 和 p(X) 一 9C ， 证 明 结 论 q(X) 。 


14.9 ”根据 规则 和 事实 的 证 明 


谓词 逻辑 中 形式 最 简单 的 证 明 可 能 涉及 以 下 两 类 前 提 。 

(1) 事实 ( fact )， 它 们 是 基本 原子 公式 。 

(2) 规则 ( rule )， 它 们 是 “如 果 - 那 么 ”形式 的 表达 式 。 我 们 在 示例 14.20 中 讨论 过 的 有 关 
C.Brown 在 课程 CS101 所 取得 成 绩 的 查询 (14.19) 就 是 一 个 例子 

(csg(“CS101”,S,G)AND snap(S,"C.Brown”, 4, P)) > answer(G) 
规则 由 蕴涵 符号 左 侧 的 一 个 或 更 多 原子 公式 的 AND 以 及 蕴涵 符号 右 侧 的 一 个 原子 公式 组 成 。 假 
设 出 现在 右 部 的 任何 变量 也 会 出 现在 左 部 中 的 某 处 。 

规则 的 左边 ( 前提 ) 叫 作 左 部 ( body )， 而 右边 叫 作 右 部 ( head )。 左 部 中 的 任 一 原子 公式 
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叫 作 子 目 标 (subgoal )。 例 如 ， 在 上 面 再 次 表示 出 的 规则 (14.19) 中 , 子 目 标 是 cvg("CS101",S,O) 
和 snap(S,"C.Brown", 4,P) 。 右 部 是 answer(G) 。 

规则 的 一 般 使 用 思路 是 ， 规 则 是 可 以 应 用 于 事实 的 一 般 原 则 。 我 们 会 试 着 通过 替换 规则 中 
的 变量 ， 将 规则 左 部 的 子 目标 与 给 定 或 已 经 证 明 的 事实 匹配 起 来 。 如 果 能 这 样 做 ， 这 种 替换 会 
使 右 部 成 为 基本 原子 公式 ， 因 为 已 经 假设 右 部 的 各 变量 都 会 出 现在 左 部 中 。 我 们 可 以 把 这 一 新 
的 基本 原子 公式 添加 到 自己 可 支配 的 事实 集中 ， 以 作 进一步 证 明之 用 。 


+ 示例 14.22 

根据 规则 和 事实 的 证 明 有 一 种 简单 的 应 用 ， 就 是 用 于 回应 第 8 章 讨 论 的 关系 模型 中 的 查询 。 
关系 对 应 的 是 谓词 符号 ， 而 关系 中 的 元 组 则 对 应 着 基本 原子 公式 ， 这 些 基本 原子 公式 具有 谓词 
符号 以 及 依次 等 同 于 元 组 组 分 的 参数 。 例 如 ， 由 图 8-1 中 的 “课程 -学 号 -成 绩 ” 关 系 ， 可 以 得 到 
如 下 事实 























csg(“ CS101”,12345,“ A”) csg(“ CS101”,67890,“ B”) 
csg(“ EE200”,12345,“C”) cse(“ EE200”,22222,“ B+”) 
csg(“CS101”,33333,“A—”) csg(“PH100”,67890,“C+”) 
同样 ， 由 图 8-2a 中 的 “学 号 -姓名 -地 址 -电话 ”关系 ， 可 以 得 到 以 下 事实 
snap(l2345,” C.Brown”, ”12Apple St.”,555 —1234) 
snap(67890,“ L.Van Pelt”,“34Pear Ave.”,555— 5678) 
snap(22222,“ P.Patty”, “56Grape Blvd.”, 555 —9999) 
对 这 些 事实 ， 可 以 添加 规则 (14.19) 
(csg (“CS101”, S, G)ANDsnap(S,”“ C.Brown’”, 4,P)) 一 answer (G) 
从 而 完成 前 提 列 表 。 
假设 想 要 证 明 answer("A") 为 真 ， 也 就 是 说 ，C.Brown 的 CS101 课 程 得 了 A。 在 证 明 开 头 部 
分 要 列 出 所 有 的 事实 和 规则 ， 虽 然 在 这 里 我 们 只 需要 规则 、 第 一 条 csg 事实 和 第 一 条 snap 事实 
即 可 。 证 明 的 前 3 行 就 是 
(1) (csg (“CS101”, S, G)ANDsnap(S,“ C.Brown”, A,P)) 一 answer(G) 
(2) csg( CS101”,12345,“ A”) 
(3) snap(]2345,” C.Brown”,“l12Apple St.”,555 —1234) 
下 一 步 是 利用 推理 规则 ( 如 果 和 万 ,是 证 明 中 某 两 行 , 则 可 以 把 巨 AND 已 写 为 证 明 中 的 一 行 ) 
把 第 二 行 和 第 三 行 结合 起 来 ， 因 此 就 有 了 这 样 一 行 
(4) csg (“CS101”,12345,“ A”)AND 
snap(l2345,” C.Brown”, 12Apple St.”,555 —1234) 
然后 ,利用 自由 变量 的 蔡 换 法 则 特 化 我 们 的 规则 一 一 第 (ID) 行 ,使 它 适 用 于 第 (4) 行 中 的 常量 。 也 
就 是 说 ， 要 在 第 (1) 行 中 进行 以 下 替换 








sub(S)=“CS101” 
sub(G)=“A” 

sub( A)=“12Apple St.” 
sub(P)=555—1234 


得 到 如 下 一 行 
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(5) csg (“CS101”,12345,“ A”)AND snap(12345,” C.Brown”,“12Apple St.”,555 —1234) 
一 answer(“ A”) 
最 后 ， 对 (4) 和 (5) 应 用 肯定 前 件 式 假 言 推理 就 得 到 该 证 明 的 第 六 行 也 是 最 后 一 行 
(6) answer(“ A”)。 


14.9.1 简化 的 推理 规则 


如 果 看 过 示例 14.22 中 的 证 明 , 就 可 以 得 出 以 下 根据 基本 原子 公式 和 人 风 辑 规则 构建 证 明 的 策略 。 

(1) 选择 一 条 要 应 用 的 规则 ， 并 选择 一 种 替换 ,将 各 个 子 目 标 转换 成 基本 原子 公式 ， 这些 基 
本 原子 公式 要 么 是 给 定 的 事实 , 要 么 是 已 经 证 明 的 内 容 。 在 示例 14.22 中 , 我 们 用 12345 替 换 了 5S， 
等 等 。 得 到 的 结果 就 如 示例 14.22 的 第 (4) 行 所 示 。 

(2) 为 替换 过 的 各 个 子 目标 创建 证 明 中 的 行 ,要 么 因为 这 些 子 目标 是 事实 ， 要 么 用 某 种 方式 
推断 出 它们 。 这 一 步 是 示例 14.22 中 的 第 (2) 行 和 第 (3) 行 。 

(3) 创建 一 行 , 表示 与 替换 过 的 各 子 目 标 对 应 的 那 几 行 的 AND。 这 一 行 是 替换 过 规则 的 左 部 。 
在 示例 14.22 中 ， 这 一 步 出 现在 第 (5) 行 。 

(4) 利用 肯定 前 件 式 假 言 推理 、 第 (3) 步 替换 过 的 左 部 ， 以 及 第 (1) 步 替换 过 的 规则 ， 推 论 出 
替换 过 的 右 部 。 这 一 步 就 是 示例 14.22 的 第 (6) 行 。 

可 以 按照 如 下 方式 把 这 些 步骤 结合 成 一 条 推理 规则 。 如 果 在 前 提 中 存在 规则 R， 而 且 存 在 
替换 xz 满足 在 替换 过 的 实例 sub(R) 中 ， 各 子 目 标 都 是 证 明 中 的 行 ， 就 可 以 把 sub(R) 的 右 部 添 
加 为 证 明 中 的 一 行 。 






































O 〇 








规则 的 诠释 
和 所 有 出 现在 证 明 中 的 表达 式 一 样 ， 规 则 也 是 因 式 全 称 量词 化 的 。 因 此 可 以 把 (14.19) 说 成 
是 “对 所 有 的 S、G、A 和 P， 如 果 csg ("CS101",S,G) 为 真 ,而且 snap(S,"C.Brown",4,P) 为 真 ， 
那么 answer(G) 为 真 "”。 不 过 ， 可 以 将 出 现在 左 部 中 但 未 出 现在 右 部 中 的 变量 ， 比 如 8、4 和 已， 
当 作 左 部 范围 内 的 存在 量词 。 正 式 地 讲 就 是 (14.19) 等 价 于 
(vG)((35)(34)(aP)(csg ("CS101",S,G)AND snap(S,"C.Brown", 4,P)) 一 answer (G)) 
也 就 是 说 , 对 所 有 的 G, 如果 存在 S、4 和 P 满 足 csg ("CS101",S,G) 和 snap(S,"C.Brown",4,P) 都 
为 真 ，answer(G) 就 为 真 。 
这 种 说 法 更 接近 我 们 应 用 规则 的 方式 。 它 表示 ， 对 右 部 中 出 现 的 变量 的 各 个 值 ， 我 们 应 该 
试 着 找 出 只 出 现在 左 部 中 的 变量 使 得 左 部 为 真 时 的 值 。 如 果 找 到 这 样 的 值 ， 则 右 部 对 所 选 的 右 
部 变量 的 值 而 言 为 真 。 
要 知道 为 什么 可 以 把 只 出 现在 左 部 中 的 变量 当 作 存在 量词 化 的 变量 ， 首 先 从 形 如 妃 一 所 
这 样 的 规则 开始 ， 其 中 是 左 部 ， 万 是 右 部 。 设 XY 是 只 出 现在 有 中 的 变量 。 这 一 规则 隐 含 着 如 下 
形式 
(v*)(B8—H) 
而 且 根 据 法 则 (14.17)， 可 以 让 对 应 X 的 量词 位 于 最 内 侧 , 将 表达 式 写 为 (V*)(VX)(B 一 玉 )。 在 
此 ，(V*) 包含 了 除了 之 外 的 所 有 变量 。 现 在 可 以 利用 只 使 用 NOT 和 OR 的 等 价 表达 式 ， 即 
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(v*)(vX)((NOT B)OR 万) 来 代替 蕴涵 式 了 。 因 为 有 没有 出 现在 万 中 ， 所 以 可 以 反 向 应 用 法 则 
(14.13), 从 而 让 (YX) 只 应 用 于 NOT B ,得 到 (Vv*)(((VX)NOT B)OR 万 )。 接 下 来 ,利用 法 则 (14.10) 
把 (VX ) 移 动 到 否定 内 ， 就 得 出 

(v*)((NoT(3X)(NoOT NOT B))oR H) 
消除 双重 否定 之 后 就 是 (V*)((NOT(3X)B)ORH) 。 最 后 ， 还 原 草 涵 就 得 到 


(vo)(((3X) 8) = 7). 





+ 示例 14.23 
在 示例 14.22 中 ， 规 则 R 是 (14.19)， 或 者 说 
(csg("CS101"， S, G)AND snap(S,"C.Brown", A, P)) 一 answer (G) 
蔡 换 sup 就 如 示例 14.22 中 给 出 的 那样 ,而 且 sw2(R) 的 子 目 标 是 示例 14.22 中 的 第 (2) 和 第 (3) 行 。 根 
据 新 的 推理 规则 ， 可 以 立即 写 出 示例 14.22 的 第 (6) 行 ， 而 不 需要 第 (4) 行 和 第 (5) 行 。 其 实 ， 只 要 
第 (1) 行 (规则 R 本 和 映 ) 是 给 定 的 前 提 ， 就 可 以 从 证 明 中 省 略 掉 它 。 





+ 示例 14.24 
再 举 个 规则 在 证 明 中 如 何 应 用 的 例子 。 考 虑 一 下 图 8-2b 中 的 “ 诬 程 -前 提 ” 关 系 ， 其 中 的 8 
个 事实 可 以 用 如 下 8 个 具有 谓词 cp 的 基本 原子 公式 表示 。 
cp(“CS101”,“CS100”) cp(“EE200”,“EE005”) 
cp (“EE200”,“CS100”) cp(“CS120”,“CS101”) 
cp(“CS121”,“CS120”) cp(“CS205”,“CS101”) 
cp(“ CS206”,“ CS121”) cp(“CS206”,“CS205”) 
我 们 可 能 希望 男 一 个 谓词 before(XX,Y) 表 示 在 选修 课程 XY 之 前 必须 修 完 诬 程 Y。 诬 程 Y 可 能 是 X 的 
前 提 ， 或 是 X 前 提 的 前 提 ， 诸如此类。 可 以 通过 以 下 描述 递归 地 定义 “之 前 ”的 概念 。 
(1) 如 末了 是 X 的 前 提 ， 那 么 7 在 X 之 前 。 
(2) 如 果 Z 是 X 的 前 提 ， 而 且 7 在 Z 之 前 ， 那 么 7 在 X 之 前 。 
规则 (D) 和 (2) 可 以 表示 为 如 下 的 谓词 逻辑 规则 。 
cp (X,Y)— before(X,Y) (14.22) 
(cp(X,2)AND before(2Z,Y)) —> before(X,Y) (14.23) 
现在 要 来 探索 一 些 根据 本 示例 开头 部 分 给 出 的 8 条 “ 访 程 -前 提 ” 事 实 以 及 规则 (14.22) 和 
(14.23) 可 以 证 明 的 before 事 实 。 首 先 ， 可 以 应 用 规则 (14.22) 把 各 条 cp 事实 转换 成 相应 的 before 事 
实 ， 得到: 








before(” CS101”,“ CSI 00”) before( EE200”,“ EE005”) 
before(“ EE200”,“ CS100”) before(“CS120”,“CS101”) 
before(” CS121”,” CS120”) before(” CS205”,“ CSI10 1”) 
before(” CS206”,“ CS12 1”) before(” CS206”,“ CS205”) 
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例如 ， 可 以 对 (14.22) 使 用 蔡 换 
sub (X)=“CSI01” 
sub, (Y)=“ CS100” 
得 到 将 换 过 的 规则 实例 
cp(“CS101”,“CS100”) —> before(“ CS101”,“ CS100”) 
这 条 规则 加 上 前 提 cp(“CS101”,“CS100”) ， 就 给 出 了 
before(“ CS101”,“ CS100”) 
现在 可 利用 规则 (14.23) 、 前 提 cp(“CS101”,“CS100”) 以 及 刚 证 明 的 事实 
before(“CS101”,“CS100”) ， 证 明 
before(“ CS120”,“ CS100”) 
也 就 是 ， 对 (14.23) 应 用 替换 
sub, (X)="“CS120” 
sub, (Y)=“ CS100” 
sub, (2Z)=“CS101” 
得 到 规则 
(cp(“CS120”,“ CS101”)AND pefore(“ CS101”,“CS100”)) > before(“ CS120”,“CS100”) 
然后 可 以 推 类 出 这 一 替换 过 的 规则 的 右 部 ， 从 而 证 明 
before(“ CS120”,“ CS100”) 
同样 ， 可 以 对 基本 原子 公式 
cp(“ CS121”,“CS120”) 
和 before(“CS120”“CS100”) 应 用 规则 (14.23), 证 明 before(“CS121”,“CS100”) 。 然 后 对 基本 原子 
公式 cp(“CS206”“CS121”) 和 before(“CS121”,“CS100”) 应 用 规则 (14.23)， 证 明 
before(“ CS206”,“ CS100”) 
还 有 奋 二 条 其 他 的 before 事 实 也 可 以 通过 同样 的 方式 来 证 明 。 








中 的 路 径 


示例 14.24 所 处 理 的 ， 是 规则 的 一 种 常见 形式 ， 它 在 给 定 有 向 图 中 释 的 情况 下 ， 定 义 了 图 
中 的 路 径 。 把 课程 当 作 节点 ， 如 果 课 程 j) 是 课程 dg 的 前 提 ， 就 存在 弧 4 一 b。 那 么 before(a,p) 就 
对 应 着 从 a 到 b 的 菜 一 条 长 度 为 1 或 更 长 的 路 径 。 图 14-9 展 示 了 基于 图 8-2b 中 “课程 -前 提 ” 信 息 
绘制 的 有 向 图 。 

在 图 表达 是 前 提 时 ， 我 们 希望 它 是 无 环 的 ， 因 为 选修 某 门 课程 的 前 提 是 修 过 这 门 课本 身 。 
不 过 ， 即 便 图 中 含有 环 路 ， 同 类 的 逻辑 规则 也 仍然 用 弧 定 义 了 路 径 。 可 以 把 这 些 规则 写成 

arc (X,Y)—> path(X,Y) 
也 就 是 说 ， 如 果 存 在 从 节点 X 到 节点 7 的 陶 ， 就 存在 从 X 到 7 的 路 径 ， 而且 
(arc(X,2)ANDpath(2,Y)) 一 path( X,Y) 
也 就 是 说 ， 如 果 存 在 从 X 到 茶 节 点 2Z 的 陶 ， 而 且 存 在 从 Z 到 7 的 路 径 ， 那 么 存在 从 X 到 7 的 路 
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径 。 请 注意 , 这 些 内 容 与 (14.22) 和 (14.23) 表 示 的 是 同样 的 规则 , 其 中 用 谓词 qrc 代 着 了 cp, 用 path 
代替 了 De1ore。 





CS206 
A 
CS121 CS205 
a 
a EE200 
ee 


图 14-9 ”表示 成 有 向 图 的 前 提 信 息 


14.9.2 ”习题 


()* 我 们 可 以 按照 以 下 方式 证 明示 例 14.24 中 的 谓词 before 是 谓词 co 的 传递 财 包 。 假 设 存 在 一 系列 的 课 
程 c 、c、…、c ,其 中 m 过 2 , 而 且 o 是 c 的 前 提 ，c, 是 c; 的 前 提 ， 以 此 类 推 , 对 i=1、2、…、 
n 一 1 而 言 ，cp(c,,c,,) 是 给 定 的 事实 。 通 过 对 i 的 归纳 证 明 对 i=2 、3、…、n,， 有 before(c,c,) ， 从 
而 证 明 c 在 wc, 之前。 

(2) 利用 示例 14.24 中 的 规则 和 事实 ， 证 明 以 下 事实 。 

(a) before(” CS120”,“CS100”) 
(b) before(” CS206”,“ CS100”) 
(3) 通过 向 示例 14.24 添 加 规则 
(before(X,2)AND before(Z,Y)) —> before( X,Y), 
可 以 提高 处 理 前 提 链 的 速度 。 也 就 是 说 ， 第 一 个 子 目 标 可 以 是 任 一 before 事 实 ， 而 不 止 是 前 提 事 
实 。 利 用 该 规则 ， 为 习题 (2) 的 (b) 小 题 找 出 更 简短 的 证 明 。 

(4)* 示例 14.24 中 有 和 多少 before 事 实 是 可 以 证 明 的 ? 

(5) 设 csg 是 代表 图 8-1 中 “课程 -学 号 -成 绩 ” 关 系 的 谓词 ，cdjp 是 代表 网 8-2c 中 课程 -日 子 -时 刻 关系 的 
谓词 ，cx 是 代表 图 8-2d 中 “课程 -教室 ”关系 的 谓词 。 并 设 wjpere(y,D, 太 及 是 表示 学 号 为 $ 的 学 生姜 
那天 BH 时 在 教室 R 上 课 。 更 精确 地 讲 ， 学 号 为 的 学 生 选 修 的 课程 是 那个 时 间 在 那个 教室 上 课 。 
(a) 写 出 用 csg、cdh 和 cr 定义 where 的 规则 。 

(b) 如 果 对 应 谓词 csg、cdh 和 cr 的 事实 是 图 8-1 和 图 8-2 中 给 出 的 ， 那么 可 以 推导 出 哪些 where 事 实 ? 
证 明 两 条 这 样 的 事实 。 














14.10 ”真理 和 可 证 性 


在 为 谓词 逻辑 的 讨论 收尾 时 ， 我 们 要 介绍 一 个 更 为 微妙 的 逻辑 问题 : 可 证 明 内 容 与 真实 内 
容 之 间 的 区 别 。 前 面 已 经 看 到 过 这 样 一 些 推理 规则 ， 它 们 允许 我 们 证 明 命题 逻辑 或 谓词 逻辑 中 
的 内 容 ， 但 我 们 不 确定 给 定 的 规则 集合 是 否 完备 ， 是 否 人 允许 我 们 证 明 每 一 个 真 命题 。 例 如 ， 我 





14.10 ”真理 和 可 证 性 619 





们 断言 12.11 节 中 所 表示 的 分 解 对 命题 逻辑 而 言 是 完备 的 。 分 解 的 一 种 一 般 化 形式 〈 这 里 没有 涵 
盖 ) 对 谓词 逻辑 而 言 也 是 完备 的 。 


14.10.1 模型 


不 过 , 要 理解 证 明 策略 的 完备 性 ,就 需要 掌握 “真理 ”的 概念 。 要 发 现 “ 真 理 ”, 需要 理解 
模型 ( model ) 的 概念 。 每 种 逻辑 对 表达 式 集 而 言 都 有 模型 的 概念 , 这些 模型 是 令 表 达 式 为 真 的 
解释 。 


+ 示例 14.25 

在 命题 逻辑 中 ， 解 释 是 真 值 赋值 。 考 虑 表达 式 B = p ANDg 和 E,=FORr。 涉 及 变量 p、gq 
和 x 的 表达 式 有 8 种 真 值 赋值 , 我 们 可 以 用 依次 对 应 各 变量 真 值 的 3 位 构成 的 位 串 来 表示 这 些 真 值 
赋值 。 

只 有 真 值 赋值 令 p 和 gq 都 为 真 ( 即 110 和 111 这 两 种 真 值 赋值 ) 时 ， 它 才能 令 表 达 式 5 为 真 。 
而 000、001、010、011、101 和 111 这 6 种 真 值 赋值 可 以 让 表达 式 ,为 真 。 因 此 只 有 一 种 对 应 表 
达 式 集 {及 ,EB,} 的 模型 ， 即 111， 因 为 上 只有 该 模型 出 现在 两 个 列表 中 。 























+ 示例 14.26 

在 谓词 逻辑 中 ， 解 释 是 14.5 节 中 定义 过 的 结构 。 我 们 来 考虑 表达 式 E 

(vX)(37)p (X,Y) 

也 就 是 说 ， 对 每 个 X 的 值 来 说 ， 至 少 存在 一 个 7 值 ， 使 得 p( 忆 7) 为 真 。 

如 果 对 定义 域 D 中 每 个 元 素 a 来 说 ， 在 D 中 存在 某 个 元 素 b ( 对 各 个 a 不 一 定 有 相同 的 5 )， 使 
得 “谓词 p 的 解释 ”这 个 关系 中 具有 成 员 “ 有 序 对 (a,5)”， 就 说 解释 使 得 为 真 。 这 些 解释 就 是 
E 的 模型 ， 其 他 的 解释 则 不 是 。 例 如 ， 如 果 定 义 域 D 是 整数 ， 而 且 当 且 仅 当头 <Y 时 ,谓词 p 的 
解释 使 得 p(X,7) 为 真 , 我 们 就 有 了 对 应 表达 式 E 的 模型 。 不过, 定义 域 D 也 是 整数 ,而 且 p 的 解 
释 是 当 且 仅 当 六 = 站 时 p(X,7) 为 真 ， 这 一 解释 就 不 是 表达 式 E 的 模型 。 














14.10.2 ”蕴涵 


在 给 定 表达 式 集 {5,E,,…,E,} 的 情况 下 ， 就 可 以 陈述 表达 式 E 为 真 的 含义 了 。 如 果 每 个 对 
应 {2,E,,…,,} 的 模型 M 也 是 对 应 E 的 模型 ， 就 说 {5,5,,…,,} 冀 涵 ( entail ) 表达 式 E。 双 十 字 
转 门 ( double turnstile ) 运算 符 F 就 表示 列 涵 ， 如 

E, Ey.., EFE 

我 们 需要 凭 直觉 意识 到 每 种 解释 都 是 一 个 可 能 存在 的 世界 。 当 说 瑟 ，B,,…，E,FEB 时 ， 也 就 是 
在 说 ， 在 使 表达 式 ，E,,…，E, 为 真 的 每 个 可 能 存在 的 世界 中 ，E 都 为 真 。 

蕴涵 的 概念 应 该 是 与 证 明 的 概念 形成 对 照 的 。 如 果 我 们 有 某 个 特定 的 证 明 系 统 ， 比 如 说 分 
解 证 明 ， 那 么 可 以 使 用 单 十 字 转 门 (single turnstile ) 运算 符 F 用 同样 的 方式 表示 证 明 。 也 就 是 
说 ， 




















< 一 


E, E,,, EHFE 
意味 着 , 对 当前 所 拥有 的 推理 规则 集 而 言 , 存在 从 前 提 五 ，E,,…，E, 到 E 的 证 明 。 请 注意 , 上 - 运 
算 符 对 不 同 的 证 明 系 统 可 能 存在 不 同 的 含义 。 还 要 记 住 ， 虽 然 我 们 一 般 乐 于 使 用 当 且 仅 当 另 一 
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者 为 真 时 一 者 为 真 的 证 明 系 统 ， 但 是 F 和 FF 不 一 定 是 相同 的 关系 。 

重 言 式 与 草 涵 之 间 有 着 密切 联系 。 特 别 要 指出 的 是 , 假设 已 ， 已 …… 已 上。 然后 可 以 声明 

(EANDE,AND:….ANDE, ) > E (14.24) 

是 重 言 式 。 奋 某 解 释 [ 喇 (14.24) 左 边 为 真 ， 则 1 是 {,E,…,B,} 的 模型 。 因 为 E,， EE,,…,E,FE,， 
所 以 三 - 定 也 能 使 有 为 真 。 因 此 /1 使 (14.24) 为 真 。 

其 他 的 可 能 就 具有 /使 14.24) 的 左边 为 假 。 这 样 一 来 ， 因 为 当 列 涵 的 左边 为 假 时 它 恒 为 真 ， 
可 知 (14.24) 还 是 为 真 。 因 此 (14.24) 是 重 言 式 。 

反 过 来 ， 如 果 (14.24) 是 重 言 式 ， 则 可 以 证 明 已 ， 媚 ，…， 已 上 已 。 这 里 把 这 一 证 明 留 作 本 节 
习题 。 

请 注意 ,我们 的 论证 并 不 取决 于 涉及 的 表达 式 是 命题 逻辑 表达 式 还 是 谓词 逻辑 表达 式 ， 或 
者 是 我 们 没有 了 解 的 某 种 其 他 逻辑 的 表达 式 。 只 需要 知道 ， 重 言 式 是 指 那些 所 有 “解释 ”都 使 
之 为 真 的 表达 式 ， 而 表达 式 或 表达 式 集 的 模型 是 指令 这 一 或 这 些 表 达 式 为 真 的 某 种 解释 。 
14.10.3 ”可 证 性 与 蕴涵 的 比较 

我 们 想 要 给 定 的 证 明 系 统 允 许 我 们 证 明 所 有 为 真 的 事物 ， 而 且 不 会 证 明 为 假 的 事物 。 也 就 
是 说 ， 我 们 希望 单 十 字 转 门 和 双 十 字 转 门 符号 表示 相同 的 含义 。 如 果 只 要 某 事 物 可 证 ， 它 也 就 
被 蕴涵 ， 那 么 该 证 明 系 统 是 相 容 的 ( consistent )。 也 就 是 说 ，E，,…， EFE 蕴涵 
已， 已 五 上 无 。 例 如 ,我 们 在 12.10 节 中 讨论 过 为 什么 命题 逻辑 的 推理 规则 是 相 容 的 。 准 确 
地 讲 ， 我们 证 明了 ， 只 要 从 前 提 五 、E,、…、, 开始 ， 并 在 证 明 中 写 出 一 行 ， 就 有 
(EANDE,AND…ANDE, ) 也 是 重 言 式 , 根 据 上 面 论证 过 的 ,这 就 秆 同 于 表述 EE，E,,…,，E,FE。 

我 们 还 希望 证 明 系 统 是 完备 的 。 这 样 就 可 以 证 明 所 有 由 前 提 药 涵 的 事物 ， 即 便 要 找到 该 证 
明 是 很 难 的 。 事 实证 明 ，12.10 节 给 出 的 推理 规则 ， 还 有 12.11 节 的 分 解 规则 都 是 完备 证 明 系 统 。 
也 就 是 说 ， 如 果 巨 ，E,,…，E, 上 FE ， 则 ，E,,…，E, 上 -EE 也 在 这 些 证 明 系 统 中 。 完 备 的 谓词 逻 
辑 证 明 系 统 是 存在 的 ， 虽然 我 们 不 会 介绍 它们 。 
14.10.4” 哥 德尔 不 完备 性 定理 

这 个 现代 数学 最 引 人 注 目的 结论 之 一 通常 被 看 作 与 我 们 刚 说 过 的 谓词 逻辑 存在 完备 证 明 系 
统 是 矛盾 的 。 事 实 上 ， 这 一 结论 并 未 涉及 前 面 讨 论 过 的 谓词 逻辑 ， 而 是 关系 到 谓词 逻辑 的 一 种 
特殊 形式 ， 这 种 逻辑 只 谈论 整数 以 及 常见 的 整数 运算 。 特 别 要 说 的 是 ， 我 们 必须 对 谓词 逻辑 加 
以 修改 ， 从 而 引入 对 应 算术 运算 的 谓词 ， 比 如 

(1) plus( 了 X,Y,Z) ， 我 们 希望 当 且 仪 当 对 + 了 =Z 时 它 才 为 真 ， 

(2) times(,Y,Z) ， 只 有 在 x 了 Y=2 时 为 真 ， 以 及 

(3) /ess(XY,7) ， 只 有 在 对 <Y 时 为 真 。 
此 外 ， 我们 需要 对 解释 中 的 定义 域 加 以 限制 ， 以 使 这 些 值 都 是 非 负 整数 。 完 成 这 一 工作 有 两 种 
方式 。 一 种 是 引入 由 我 们 断言 为 真 的 表达 式 构 成 的 表达 式 集 。 通 过 恰当 地 选择 这 些 表 达 式 ， 任 
何 满足 表达 式 的 解释 中 的 定义 域 都 必须 “看 似 ” 整 数 ， 而 且 像 plus 或 less 这 样 的 特殊 谓词 必须 具 
有 和 同名 运算 相同 的 行为 。 


+ 示例 14.27 
我 们 可 以 断言 像 
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plus(X,Y,Z) > plus(Y,X,Z) 
这 样 表示 加 法 交换 律 的 表达 式 ， 或 表示 < 关系 传递 性 的 表达 式 
(less (X,Y) AND less(Y,2)) —> /ess(X,Z) 

也 许 理 解 哥 德尔 的 定理 为 谓词 逻辑 带 来 的 限制 有 种 更 简单 的 方式 ， 就 是 假设 这 种 逻辑 只 多 
许 一 种 模型 ， 这 种 模型 的 定义 域 是 非 钠 整数， 而且 为 这 些 特殊 的 谓词 给 定 了 与 它们 的 约定 含义 
对 应 的 关系 。 例 如 ， 我 们 可 以 令 对 应 谓词 plus 的 解释 为 

{(a,b,c)|a+b=c} 

哥 德 尔 的 定理 说 的 是 ， 不 管 选 择 什么 相 容 的 证 明和 系统， 总 是 存在 某 个 为 真 但 不 可 证 明 的 表 
达 式 E! 更 精确 地 讲 ， 如 果 巨 、E,、…、E, 是 其 模型 相当 于 非 负 整数 的 这 样 一 些 表达 式 ， 那 么 
有 EE，E,,…，E, 上 FE 为 真 ,但 妃 ，E,,…，E, 上 -为 假 。 也 就 是 说 ， 在 我 们 选 定 的 证 明 系 统 中 ， 
不 可 能 根据 {5,E,,…,E,} 证 明 E。 

对 选 定 的 不 同 证 明 系 统 而 言 ， 不 可 证 明 的 表达 式 E 可 能 是 不 同 的 。 事实 上 ， 所 选 的 表达 式 E 
可 被 视 作 把 该 表达 式 本 身 在 给 定 证 明 系 统 中 不 可 证 明 这 一 事实 编码 为 整数 的 一 种 方法 。 
14.10.5 ”计算 机 能 完成 的 工作 的 限制 

可 德尔 的 理论 表明 我 们 回答 与 数学 相关 的 问题 的 能 力 是 有 限 的 。 如 果 拥 有 像 整数 这 样 复 杀 
的 数学 模型 ， 以 及 我 们 在 本 书 中 已 经 见识 过 的 ， 比 整数 还 要 复杂 得 多 的 数学 模型 ， 就 不 存在 将 
真 命题 与 假 命 题 区 分 开 的 机 械 方式 。 我 们 能 做 到 的 最 多 也 就 是 利用 某 种 相 容 的 证 明 系 统 以 便 可 
以 寻找 证 明 。 如 果 找 到 一 种 ， 就 算是 非常 入 运 了 ， 而 且 可 以 确定 被 证 明 的 命题 为 真 。 不 过 ， 这 
种 找寻 可 能 一 直 继 续 下 去 ， 而 永远 都 找 不 到 证 明 ， 即 便 该 命题 为 真 。 也 就 是 说 ， 我 们 定义 手头 
的 数学 模型 时 所 做 的 假设 蕴涵 了 该 命题 。 

从 哲学 的 角度 讲 ， 这 种 情况 说 明了 数学 永远 会 是 充满 乐趣 和 挑战 的 。 从 实践 的 角度 讲 ， 它 
表明 用 计算 机 可 以 完成 的 任务 是 有 限 的 。 特别 要 指出 的 是 , 虽然 可 以 编写 程序 在 简单 的 系统 ( 比 
如 命题 逻辑 或 不 含 任何 特殊 谓词 或 限制 的 谓词 逻辑 ) 中 寻找 证 明 , 但 没 法 为 足够 复杂 的 系统 完成 
这 一 工作 。 大 家 应 该 看 看 下 文 附注 栏 内 容 “不 可 判定 性 ”， 这 里 讨论 了 一 个 与 哥 德 尔 不 完备 性 定 
理 有 关 的 定理 。 不 可 判定 性 的 理论 让 我 们 可 以 指出 一 些 可 证 明 计算 机 无 法 解决 的 具体 问题 。 






































不 可 判定 性 


逻辑 学 家 阿兰 ' 图 灵 ( Alan Turing ) 在 20 世 纪 30 年 代 就 创立 了 正式 的 计算 理论 ， 这 要 比 根 
据 他 的 理论 构造 的 电子 计算 机 早出 现 很 久 。 这 一 理论 最 重要 的 结果 就 是 发 现 某 些 问题 是 不 可 判 
定 的 (undecidable )， 无 论 什么 计算 机 都 不 能 解答 这 些 问题 。 

该 理论 最 重要 的 特征 是 图 灵机 ( Turing machine )， 一 种 由 有 限 自 动机 和 被 分 成 无 限 个 方 格 
的 纸 带 组 成 的 抽象 计算 机 。 在 一 次 移动 中 ， 图 灵机 可 以 读 它 的 读 写 头 (tapehead ) 看 到 的 那个 
方 格 中 所 含 的 字符 ， 并 根据 这 个 字符 以 及 图 灵机 的 当前 状态 ， 用 另 一 个 字符 代替 该 字符 ,改变 
图 灵机 的 状态 ， 并 将 读 写 头 左 移 或 右 移 一 格 。 很 明显 ， 所 有 真实 的 计算 机 ， 以 及 其 他 那些 研究 
计算 机 应 该 是 怎样 的 数学 模型 ， 都 刚好 能 计算 图 灵机 可 以 计算 的 内 容 。 因 此 可 以 把 图 灵机 当 作 
计算 机 的 标准 抽象 模型 。 

不 过 ， 我 们 不 必 详 细 了 解 图 灵机 是 怎样 给 图 灵 的 理论 增色 的 。 只 要 拿 它 作为 计算 机 模型 ， 
那 种 读 字 符 输 入 并 且 只 有 两 种 可 能 的 写 语句 printf("yes\n") 和 printf("no\n") 的 C 语 
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言 程 序 ， 就 足够 了 。 此 外 ， 在 产生 任 一 种 输出 后 ， 该 程序 必须 终止 ， 这 样 它 才 不 会 随后 产生 了 矛 
盾 的 输出 。 要 理解 ， 这 类 程序 在 接受 某 些 输入 后 可 能 既 不 能 回应 “yes” 也 不 会 回应 “no”， 而 
是 在 循环 中 一 直 循 环 下 去 。 

我 们 将 要 证 明 ， 不 存在 像 图 14-10a 所 示 的 “判定 器 ”程序 D 这 样 的 程序 。 假 设 D 接 受 上 述 
特殊 类 型 的 程序 P 作 为 输入 ， 在 给 定 P 本 身 作为 P 的 输入 时 ， 若 P 说 “yes”"， 则 DD 说 “yes”。 而 在 
给 定 P 作 为 P 的 输入 时 ， 若 P 说 “no” 或 者 P 没 法 进行 任何 判定 ， 则 D 说 “no”。 正 如 我 们 将 要 看 
到 的 ， 正 是 这 一 要 求 使 得 D 可 以 算出 什么 时 候 P 从 不 会 作出 使 得 DD 无 法 写 的 判定 。 

不 过 ,假设 这 样 的 DD 存在 ， 要 编写 如 图 14-10b 所 示 “ 求 补 器 ”程序 C 就 是 个 简单 问题 了 。C 
是 根据 假设 的 D， 通 过 把 所 有 打印 “no” 的 语句 变 成 打印 “yes” 的 语句 ， 并 把 打印 “yes” 的 
语句 变 成 打印 “no” 的 语句 而 形成 的 程序 。 

现在 可 以 询问 ， 如 图 14-10c 所 示 ， 在 把 C 本 身 提供 给 C 作 为 输入 时 ， 会 发 生 什么 ? 如 果 C 说 
“yes"”， 那 么 按照 图 14-10b 表 示 的 ，C 会 断言 “C 针 对 输入 C 不 会 说 “yes” ”。 如 果 C 说 “no”， 那 
C 会 断言 “C 针 对 输入 C 会 说 “yes”"。 现 在 就 有 了 类 似 罗素 悖 论 的 了 矛盾， 其 中 C 没 法 真实 地 说 


么 
出 “yes” 和 “no ”。 

结论 就 是 ， 这 样 的 判定 器 程序 DD 其 实 是 不 存在 的 。 也 就 是 说 ，D 可 以 解决 的 问题 ， 也 就 是 
在 给 定 其 自身 作为 输入 时 类 型 限制 为 说 “yes” 或 没 法 说 “yes”( 通过 说 “no” 或 什么 都 不 说 ) 
的 C 语 言 程序 ， 是 不 能 由 计算 机 解决 的 。 它 是 个 不 可 判定 的 问题 。 

自 图 灵 最 初 的 结果 起 ， 现 已 发 现 种 类 人 繁多 的 不 可 判定 问题 。 例 如 ， 菜 给 定 输入 是 否 会 让 给 
定 的 C 语 言 程序 进入 无 限 循环 ， 或 两 个 C 语 言 程序 在 接受 相同 输入 时 是 否 会 产生 相同 的 输出 ， 
都 是 不 可 判定 的 。 





7 如 果 P 对 输 入 P 说 “yes” 就 是 “yes” 


—D 
~ 如 果 P 没 对 输入 P 说 “yes” 就 是 “no” 





(a) 假设 的 判定 器 D 





7 如 果 P 没 对 输入 P 说 “yes” 就 是 “yes” 
P— CGC 
玉 如 果 P 对 输入 P 说 “yes” 就 是 “no” 





(b) 求 补 颖 C 





(c) 在 以 其 自身 作为 输入 时 ，C 会 做 些 什么 ? 
图 14-10 ”图 灵 构 造 的 一 部 分 
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因此 ， 本 书 并 不 是 要 以 负面 的 声音 收尾 ， 而 是 要 用 不 可 判定 性 这 一 理论 提醒 我 们 ， 和 数学 
一 样 ， 计 算 机 科学 也 注定 是 挑战 最 优秀 人 才 的 。 深 入 研究 这 一 学 科 的 学 生还 将 了 解 到 避免 这 种 
不 可 判定 ( 而 且 难 以 苔 驭 ) 的 情况 所 需要 的 科学 与 艺术 。 这 些 学 生 之 后 可 能 会 加 入 到 推进 计算 
机 发 展 的 科学 家 和 工程 师 的 队伍 之 中 。 


14.10.6 ”习题 


( 设 已 =P，,， 已 =9qg，, 而 且 已 =gor+ 太 。 描 述 使 车, 杞 } 为 真 的 模型 ( 命题 变量 pz、 和 zx 的 真 值 赋 值 ) 。 
描述 ,的 模型 。 巨 ,E,F 玉 ,是 否 为 真 ?为 什么 ? 

(QQ) ** 考虑 以 下 谓词 逻辑 表达 式 。 
a) E=(vX)p(X,X) 
b) E,=(vX)(vY)(p(X,7)—> p(Y,X)) 

v7Y)(vZ)((p(X,Y)AND p(Y,2)) > p(X,2)) 

d) E,=(vX)(vY)(p(X,Y)oRp(Y,X)) 
e) Es=(vX)(3Y)p(X,Y) 
这 5 个 表达 式 中 哪个 表达 式 是 由 其 他 4 个 表达 式 蕴 涵 的 ?在 各 情况 中 ， 要么 给 出 与 所 有 可 能 的 解 
释 有 关 的 论证 以 证 明 这 种 蕴涵 ， 要 么 给 出 可 以 作为 其 中 4 个 表达 式 的 模型 但 不 是 第 5 个 表达 式 的 
模型 的 某 种 特定 解释 。 提 示 : 首先 可 以 想象 谓词 p 表 示 有 癌 图 的 弧 , 并 把 各 表达 式 看 作 图 的 属性 。 
7.10 广 中 的 材料 应 该 能 提供 一 些 提示 , 包括 如 何 找到 定义 域 是 某 图 节点 而 且 谓词 p 是 该 图 弧 的 合 
适 模 型 ,或 者 是 如 何 证 明 为 何 一 定 存在 蕴涵 。 不 过 请 注意 ， 只 强调 该 解释 是 图 ， 并 不 足以 证 明 
蕴涵 。 

(3)* 设 5 和 5, 是 两 个 谓词 逻辑 (或 者 是 命题 逻辑 ， 这 都 没关系 ) 表达 式 集合 ， 并 设 它们 对 应 的 模型 
集合 分 别 是 M 和 。 
(a) 证 明 对 应 表达 式 集合 9 5, 的 模型 集合 是 Mi mW 。 
(b) 对 应 表达 式 集 合 S, "5, 的 模型 集合 是 否 总 是 Mi UM,? 
(4)* 证 明 : 如 果 (EANDE,AND…ANDE, ) 下 是 重 言 式 , 就 有 EE, E,,…, E,FE。 











) 
cj) E, =(vX)( 
) 
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大 家 应 该 从 本 章 中 了 解 到 了 如 下 要 点 。 

D 谓词 逻辑 用 原子 公式 ( 即 沉 参数 的 谓词 ) 作为 原 词 操作 数 ， 并 使 用 命题 逻辑 运算 符 以 及 
两 个 量词 “对 所 有 ”和 “存在 ”。 

口 谓词 逻辑 表达 式 中 的 变量 受 量词 约束 的 方式 ， 类 似 程 序 中 的 变量 受 声明 约束 的 方式 。 

D 与 命题 逻辑 中 的 真 值 赋值 不 同 , 在 谓词 逻辑 中 我 们 有 一 种 名 为 “解释 ”的 更 复杂 的 结构 。 
解释 是 由 定义 域 、 定 义 域 上 对 应 请 词 的 关系 ， 以 及 从 定义 域 对 应 任何 自由 变量 的 值 组 
成 的 。 

口 使 得 表达 式 集 为 真 的 解释 就 是 该 表达 式 集 的 “模型 ”。 

D 谓词 演算 的 重 言 式 是 那些 对 每 种 解释 而 言 都 能 得 出 TRUE 的 表达 式 。 尽 管 很 多 重 言 式 是 通 
过 对 命题 逻辑 重 言 式 进行 蔡 换 得 到 的 ， 但 也 存在 一 些 涉及 量词 的 重要 重 言 式 。 

D 每 个 谓词 逻辑 表达 式 都 可 以 表示 为 “前 束 式 ” 表 达 式 ， 它 是 由 无 量词 表达 式 最 后 应 用 量 
词 运算 符 构 成 的 。 
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D 谓词 逻辑 中 的 证 明 可 以 通过 与 构建 命题 逻辑 中 的 证 明 类 似 的 方式 构建 。 

D 在 重 言 式 中 用 常量 替换 变量 可 得 到 另 一 个 重 言 式 ， 这 一 推理 规则 在 证 明 中 是 很 实用 的 ， 
特别 是 在 处 理 大 量 的 事实 和 规则 时 。 

口 如 有 果 表 达 式 集 {五 …,,} 的 任 一 模型 同时 也 是 表达 式 甩 的 模型 ， 则 该 表达 式 集 “ 毕 涵 ” 表 
达 式 FE。 如 果 五 ，…， 已 草 涵 已， 在 给 定 五 ，…， 互 作为 前 提 时 就 把 5 视 为 “ 真 ”。 

口 哥 德 尔 的 定义 说 明了 ， 如 果 我 们 用 摘 述 数论 ( 即 非 负 整数 的 算术 ) 的 表达 式 作为 前 提 ， 
那么 对 任何 证 明 系 统 而 言 ， 部 存在 一 些 由 前 提 强 涵 但 不 能 通过 前 提 证 明 的 表达 式 。 

口 图 灵 的 定理 描述 了 “图 灵机 ”这 种 正式 的 计算 机 模型 ， 并 表示 存在 不 能 由 计算 机 解决 的 


问题 。 
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看 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com ， 会 有 编辑 或 作 译 者 协助 
答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 
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